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VORWORT 


Dieses Skriptum basıert auf dem seıt 1997 erstellten Skrıptum „Wirtschaftsinformatık”, das 
in den Versionen von 2000 bis 2002 vom Autor gemeinsam mit Prof. Stefan Nieland, FHDW 
Paderborn, ausgestaltet worden ist. Ihm gebührt daher Dank für die Mitwirkung bei einer 
Reihe von Abschnitten sowie für zahlreiche Korrekturvorschläge zum gesamten bisherigen 
Skrıptum. 


Gegenüber dem Skriptum „Wirtschaftsinformatik” kamen insbesondere die Abschnitte zu 
Algorıthmen und Datenstrukturen, zur Kryptographie und zur Theoretischen Informatik hinzu. 
Daneben wurden eine Reihe von Details verbessert und für die Zielgruppe der angehenden 
Diplom- Wirtschaftsinformatiker/innen angepasst. 


Im Februar 2004 erschienen einige Teile dieses Skriptums - ergänzt um Kapitel zu Analyse, 
Einführung und Einsatzgebieten von betrieblichen Informationssystemen - ım Oldenbourg- 
Verlag als eigenständiges Buch “W irtschaftsinformatik” gemeinsam mit Prof. S. Nieland 
(FHDW Paderborn) und Prof. H. Schröder (FH Nordakademie); sh. hierzu die entsprechende 
Literaturangabe [BaeNieSchr] auf S. 246. 


Die hier vorliegende Fassung dieses Skriptums wurde ım Juni 2004 um Teile zur 
Codierungstheorie und Datenkompression erweitert. Daneben wurden einige kleinere 
Modifikationen und Korrekturen am bisherigen Text vorgenommen. Speziell danke ıch der 
Gruppe bfw403 für sachdienliche Korrekturhinweise zum Kapitel 5 (Kryptologie). 


Im September 2022 wurde die vorliegende Fassung editiert. 
Für weitere ergänzende Anmerkungen sowie Hinweise auf mögliche Fehler ıst der Autor 
stets dankbar. 


EINLEITUNG 


Informatik‘ ist die Wissenschaft, Technik und Anwendung der maschinellen Verarbeitung 
und Übermittlung von Informationen. Man unterscheidet die Teilgebiete Theoretische 
Informatik (Automatentheorie, Schaltwerktheorie, Formale Sprachen (vgl. [Balke])), 
Technische Informatik (Schalttechnologie und Rechnerarchitekturen), Praktische Informatik 
(Betriebssysteme (vgl. [Bengel]), Compilerbau (vel. [Aho] und [Baeumle2]), 
Softwaretechnologie) und Wirtschaftsinformatik. 


Informatik 
Informations- Informatik- Informatik- 
technik Anwendungen Nutzung 
Methoden der Verfahren der 
Entwicklung tionstechnik 
Ingenieur- Wirtschafts- Rechts- Verwaltungs- Medizinische- 
Informatik informatik informatik informatik Informatik 


Übersichtsgraphik entnommen aus [Stahlknecht]. 


Die Gesellschaft für Informatik (Gl), die Standesvertretung der Informatiker, definiert 
Informatik als Wissenschaft, Technik und Anwendung der maschinellen Verarbeitung und 
Übermittlung von Informationen; die Informatik umfasst 


°e die Informationstechnik (Computer-Hardware, Methoden der Softwareentwicklung, 
Verfahren der Kommunikationstechnik, 


° die Informatikanwendungen ın allen Fachgebieten und 
° die Informatik-Nutzung durch Anwender und Benutzer. 


Die Informatikanwendungen, zu denen dıe Wirtschaftsinformatik gehört, werden auch als 
„Bindestrich-Informatiken” bezeichnet. 


Die ın der obigen Abbildung aufgeführten Informatik-Anwendungen lassen sıch durch Ihre 
Hauptarbeitsgebiete wıe folgt charakterisieren. 


°e Ingenieurinformatık: Statik, Vermessungstechnik, Verkehrswesen und alle anderen 
Ingenieurswissenschaften, computergestütztes Konstruieren (CAD = Computer Aıded 
Design), computergestützte Fertigung (CAM = Computer Aıded Manufacturing) ein- 
schließlich numerisch gesteuerter Werkzeugmaschinen, Prozeßautomatisierung, Robotik. 


' Eine sehr schöne, breit angelegte Einführung ın dıe Informatik mittels konkreter Fragestellungen bietet das Buch „Der 
Turing Omnibus” [Dewdney]. Dabei gehen dıe Antworten des Buches allerdings davon aus, dass der Leser oder die 
Leserin nıcht durch die eine oder andere mathematische Formel abgeschreckt wird. 
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e Wirtschaftsinformatik: dıe Umsetzung von einzelnen Anwendungen in ablauffähige, 
vernetzte Systeme, das Informationsmanagement (Bereitstellen von Werkzeugen der 
Informations- und Kommunikationstechnologie), Fragen der Beschaffung erforderlicher 
Soft- und Hardware, Aufwandsabschätzungen für die Datenorganisatıion, nicht zuletzt 
aber dıe Festlegung bzw. der Entwurf der relationalen Datenbankschemata und die 
Fragen der Informationsaufbereitung z.B. für die Unternehmensleitung. Hierfür haben wır 
ein eigenes Kapıtel zum Thema ‚Relationale Datenbanken” vorgesehen (S. 198 ff). 


°e Rechtsinformatik: Juristische Informations- und Dokumentationssysteme, Datenschutz- 
gesetzgebung, Vertragsgestaltung bei Hardware- und Softwarebeschaffung, Urheber- 
schutz für Software, Computerkriminalität. 


e Verwaltungsinformatik: Einwohnermeldewesen, Finanzverwaltung, Polızeiı, Haushalts- 
wesen, Liegenschaftsverwaltung, Bevölkerungsstatistik. 


e Medizinische Informatik: Befunderhebung und -auswertung, Therapieplanung, Labor- 
Analyse, Computer-Tomographıe. 


Dieses Skriptum stellt nur eine Ergänzung zur Vorlesung dar; es muss selbstverständlich 
nıcht alles ın der Veranstaltung selbst behandelt werden, was hier erwähnt wird. Auf der 
anderen Seite kann es jederzeit sein, dass kurzfristig weitere Inhalte in die Vorlesung 
aufgenommen werden, die zum Zeitpunkt der Fertigstellung noch nicht ın diesen Text 
eingeflossen sınd. 


Eın über 800 Seiten umfassendes, m.E. sehr gutes Einführungswerk ın zahlreiche Aspekte der 
Informatık ıst der “Grundkurs Informatık” von Hartmut Ernst, das hiermit für einen 
weitergehenden Einstieg empfohlen wird; vgl. [Ernst] ım Literaturverzeichnis. 
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1. DIE ERSTEN GRUNDLAGEN 


Zunächst einmal sollen ın ziemlich kompakter Form die Grundlagen eines elektronischen 
Datenverarbeitungssystems vorgestellt werden. 


1.1. Historie und Grundbegriffe 


1.1.1. Historie? 


Die Grundlage für die Entwicklung zum Rechnen mit Maschinen bildet das ın Indien um 500 
n.Chr. entstandene und über die arabische Welt zu uns gelangte sogenannte Aindu-Arabische 
Zahlensystem mit den zehn Ziffern 0, 1, 2, 3, 4, 5, 6, 7, 8 und 9. 


Im Vergleich zu dem aus Asterix-Heften bekannten Römischen Zahlensystem (z.B. 
MCMVI), das im 3. Jahrhundert v. C. aufkam, kennt das „Zehnersystem” die Zahl 0, und es 
ist ein Stellenwertsystem, das - wie unsere Erfahrungen zeigen - sehr vıel einfacher 
handhabbar ist. 


Im Jahre 1623 entwickelt der Theologe und Mathematiker Schickard für den Astronomen 
Kepler eine Rechenuhr, dıe auf dem Zählradprinzip aufbaute. Damit waren Addition und 
Subtraktion möglich, wobei mit sechs Stellen und einem Übertrag gearbeitet wurde. 


1641 baut der französısche Mathematiker Blaıse Pascal mıt 19 Jahren seinem Vater eine 
Addiermaschine mit sechs Stellen. 1650 wurde der Rechenschieber’ erfunden. 1703 begann 


Gottfrred Wilhelm Leibniz sıch mit dem i 


Dualsystem („Zweiersystem”) zu beschäftigen, das 


zur Grundlage der heutigen Datenverarbeitung 
wurde. 


mu 


| 
. 
® 


1 
Mi 


1833 entwickelte der Mathematik-Professor 
Charles Babbage eine mechanische Rechenanlage 
„Difference Engine”; dıe Architektur dieser Anlage 
bestand aus einem Speicher (store), einem 
Rechenwerk (mill), einem Steuerwerk (control), 
einer Eın-/Ausgabeeinheit (input/output) und 
einem ın Form von Lochkarten gespeicherten Programm. 


Ze - 


1890 führte Hollerith im Rahmen der elften amerikanischen Volkszählung dıe Lochkarten- 
technik ein. Seit ca. 1920 wurden leistungsfähige Büro-Lochkartenmaschinen (z.B. von der 
Fırma Bull) entwickelt. 


1936 entwickelte der Bauingenieur Konrad Zuse seine auf dem Dezimalsystem basıerende 
Rechenanlage Z1, welche die immer wiederkehrenden Berechnungen ım Bereich der Statık 
automatisieren sollte. 1941 konstruierte er dıe Z3, dıe auf dem Dualsystem basierte, einen 


Teilweise zitiert nach [Dworatschek]. 

Der Rechenschieber dürfte übrıgens das bekannteste Beispiel eines Analog-Rechners sein, bei dem also nicht diskrete 
Werte, sondern ein stetiger Bereich von Werten verarbeitet wırd. Anders formuliert: bei einem Rechenschieber kann man 
dıe Zahl I auch „ungenau” einstellen... 
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Relaisrechner mit Lochstreifenein- und -ausgabe, das ein Programm in Form eines 
Lochstreifens speichern konnte. 


Abbildung: Lochstreifen 
Quelle: https://de.wikipedia.org/wikv/Lochstreifen#/media/Datei:Lochstreifen-2.png 


Erst mit dem Einzug von Java’ seit ca. 1995 splittet sich der Bereich der 
Softwareentwicklung wieder auf, und es ıst davon auszugehen, dass C/C++ und Java ıhre 
jeweiligen Einsatzfelder finden und behalten werden. 


Unter dem Begriff der „Mittleren Datentechnik” (MDT) wurden ab den Sechziger Jahren 
Rechner konstruiert, die dıe Gerätekomponenten aus der Büromaschinentechnik integriert 
hatten: Tastatureingabe, Formulartransport und Drucker. Dazu kam die verstärkte Nutzung 
der Magnetspeicherung. 


Aus der Entwicklung spezialisierter Computer für die Steuerung und Überwachung 
technischer Prozesse entstand der Zweig der sogenannten „Mini-Computer”. Hierzu gehören 


*  Vereinfacht ausgedrückt könnte man Java als „die Programmiersprache für das Internet” beschreiben. 
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dıe legendäre PDP 11 von Digital Equipment 
(siehe Bild rechts) oder die HP 3000 Serie 
von Hewlett Packard. 


Seit 1971 sınd „Mikro-Computer” auf dem 
Markt, dıe sich durch eine sehr hohe Inte- 
gration der Schaltungstechnik auszeichnen. 
Aus diesem Sektor heraus erwuchsen dann | 
seit 1981 auch die Home und Personal 
Computer heutiger Prägung, aber auch die 
Apple Macintosh. 


1.1.2. Grundbegriffe 


In der DIN 44 300 wird ein Datenverarbeitungssystem definiert als eine Funktionseinheit zur 
Verarbeitung von Daten, d.h. zur Durchführung mathematischer, umformender, 
übertragender und speichernder Operationen. 


Daten stellen dabei Informationen (Angaben über Sachverhalte oder Vorgänge) aufgrund 
bekannter oder unterstellter Abmachungen in einer maschinell verarbeitbaren Form dar. 


Unter analoger Rechentechnik versteht man das Verarbeiten kontinuierlicher Sıgnale, z.B. 
Messung eines Zeigerausschlages (ideell gesehen: beliebig genau); demgegenüber sınd beı 
digitaler Rechentechnik nur endlich viele, diskrete Werte möglich. Auf einer klassıschen 
Analoguhr könnte man theoretisch der Position des Stundenzeigers alleine dıe genaue 
Uhrzeit entnehmen. Bei einer Digitaluhr werden dagegen nur ganzzahlige Werte von 
Minuten (oder ggf. Sekunden) angezeigt, eine genauere Informatıon ıst der digitalen Angabe 
nıcht zu entnehmen. 


° Zitiert nach [Hansen], S. 10. 
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1.2. Logik 


In der formalen Logik wird systematisch untersucht, wie man Aussagen miteinander 
verknüpfen und auf welche Weise man formale Schlüsse ziehen, Beweise durchführen kann. 


In unserem Rahmen unterscheiden wir die Aussagenlogik und dıe Prädikatenlogik, dıe wir 
beide kurz vorstellen wollen. 


1.2.1. Aussagenlogik 


In der Aussagenlogik werden einfache Verknüpfungen mittels „und” und „oder” zwischen 
Aussagesätzen (oder deren Negatıon) untersucht. Beispiele für solche Aussagesätze sınd 


A := „Düsseldorf ıst die Landeshauptstadt von Nordrhein-Westfalen” 
B := „Die FHDW hat ıhren Hauptsitz ın Paderborn” 
C := „Bergisch Gladbach liegt westlich von Köln” 


Diese „atomaren” Aussagen können jeweils wahr (true) oder falsch (false) sein. Man spricht 
hierbei von einem Wahrheitswert. 


Im Rahmen der Aussagenlogik interessiert man sıch für dıe Zusammenhänge, wıe sıch aus 
den Wahrheitswerten solcher elementaren Aussagen die von komplexeren 
Zusammensetzungen ergeben wie beispielsweise: 


D := (A und C) = „Düsseldorf ıst dıe Landeshauptstadt von Nordrhein-Westfalen” und 
„Bergisch Gladbach lıegt westlich von Köln”. 


Die Aussage D ist, wie wir wissen, falsch, da bereits die Teil-Aussage C falsch ist. 


Wir definieren: Symbole, die Aussagesätze oder kurz Aussagen repräsentieren, nennen wir 
atomar oder Atome. Jedem Atom können wir (eindeutig) einen der Wahrheitswerte wahr oder 
falsch zuordnen. 


Folgende fünf logische Verknüpfungen werden ın der Aussagenlogik üblicherweise 
betrachtet. 


Bedeutung 


oder Disjunktion 
Implikation 


Anmerkung: formal käme man mit weniger als diesen fünf Operationen aus. Es ıst jedoch 
sehr zweckmäßig, ın der Praxis diese fünf Verknüpfungen einsetzen zu können. 


° Zitiert nach [Schöning], S. 11. 
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Sehen wır uns einige Beispiele und allgemeinen Sachverhalte an. 


l. Isteine Aussage A wahr, so ıst die Negation — A (lies: „nicht A”) falsch. 
Wenn der Satz „Rom ist die Hauptstadt Italiens” wahr ist, dann ıst dıe Aussage 
— „Rom ıst die Hauptstadt Italiens” = „Rom ist nıcht die Hauptstadt Italiens” 
falsch. 


2. Die verknüpfte Aussage A AB (lies: „A und B”, Konjunktion) ıst genau dann wahr, wenn 
A wahr ıst und B wahr ist. 
„Ich habe Urlaub” A „ich fahre nach Frankreich” (umgangssprachlich: ‚ich habe Urlaub 
und fahre nach Frankreich”) ıst genau dann wahr, wenn beide Sachverhalte zutreffen. 


3. Die Oder-Verknüpfung (Disjunktion) A v B („A oder B”) ist genau dann wahr, wenn 
mindestens eine der beiden Aussagen A oder B zutreffen. Das heißt umgekehrt: A v B ıst 
nur dann falsch, wenn A falsch ıst und B falsch ist. 

„Ich gehe ın’s Kino” oder „ich besuche ein Konzert” ıst bereits dann wahr, wenn ıch 
beispielsweise tatsächlich ın ein Konzert gehe. 

„Ich gehe vormittags ın die Vorlesung” oder „ich gehe nachmittags ın’s Schwimmbad” ıst 
- entgegen dem üblichen Verständnis - aber auch dann wahr, wenn ich beides erfülle, also 
dıe Vorlesung am Vormittag besuche und am Nachmittag ın das Schwimmbad gehe! 


4. Die /mplikation AB („wenn A, dann B”) ist so definiert, dass sie nur dann falsch ist, 
wenn A wahr ıst, B jedoch falsch. Jede andere Konstellation führt zu einer wahren 
Implikation. Aus einer falschen (bzw. nıcht erfüllten) Voraussetzung kann man ım Sinne 
der Aussagenlogik alles schließen. 

Wahr sind also die folgenden Beispiele: „wenn der Papst eine Frau ist’, dann regnet es 
jeden Tag in Rom”, ‚wenn die Temperatur im Zimmer des Direktors auf über 45 Grad 
ansteigt, dann bekommen die Schüler hitzefrei” sowie „wenn Elefanten acht Beine haben, 
dann essen Schnecken Mäuse”. 

Die Implikation wırd also nur dann falsch, wenn wir aus einer wahren Aussage eine 
falsche schließen (wollen): ‚wenn Rom die Hauptstadt Italıens ıst, dann ıst der Papst eine 
Frau”. 


5. Die Äquivalenz AB („A ist äquivalent zu B”) schließlich ist genau dann wahr, wenn A 
und B dieselben Wahrheitswerte besitzen. 
Wahr sind also die Äquivalenzen „wenn Rom die Hauptstadt Italiens ist, dann ist Paris 
dıe Hauptstadt von Frankreich” und „wenn Paris dıe Hauptstadt Italıens ıst, dann ıst Rom 
dıe Haupstadt von Frankreich”. 
Falsch ist eine Äquivalenz, wenn eine Seite falsch, die andere aber wahr ist: „wenn Rom 
dıe Hauptstadt Italiens ıst, dann ıst Rom die Hauptstadt von Frankreich”. 


"Das Beispiel mit dem weiblichen Papst eignet sich in diesem Rahmen einigermaßen gut, weil nach bisheriger Erfahrung 
davon auszugehen ıst, dass die katholische Kirche von ıhren diesbezüglichen Gewohnheiten nicht gerade ım Verlauf 
dıeser Vorlesung abweichen wird. 
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Die formalen Definitionen dieser fünf Verknüpfungen (Operationen) lassen sıch durch 
sogenannte Wahrheitswertetafeln darstellen. 


In der obigen Wahrheitswertetafel wird die Negatıon dargestellt: —-A ıst falsch, wenn A wahr 
ist; „A ıst wahr, wenn A falsch ist. 


In der zweiten Wahrheitswertetafel werden dıe anderen Operationen, dıe zwei Aussagen 
miteinander verknüpfen, dargestellt. Man spricht hier von binären oder zweistelligen Ver- 
knüpfungen. (Die Negatıon ist demgegenüber eine unäre oder einstellige Operation.) 


Während die Definitionen der ersten drei Verknüpfungen einem normalen Menschen nach- 
vollziehbar sein dürften, sträubt sich der gesunde Menschenverstand zunächst gegen die 
Festlegung der Implikation und der Äquivalenz. 


Jedoch sınd die obigen Definitionen vielleicht besser verständlich, wenn wir uns die 
folgenden üblichen Schlußfolgerungen ansehen. 


Zur Implikation: gelten die beiden Aussagen A>Bund—-A=B, dann ist B offensichtlich 
unabhängig von A (bzw. — A) erfüllt. 
Formelhaft könnte man also schreiben: (A>B)A(-A=>B) > B. 


Zur Äquivalenz: die „genau dann, wenn”-Verknüpfung wird üblicherweise als „wenn A wahr 
ist, dann ist auch B wahr - und umgekehrt” wiedergegeben. Das bedeutet aber auch, dass A 
falsch sein muss, wenn B falsch ist. 


Man spricht von einer Tautologie, wenn dıe Aussage immer wahr ist. Ein elementares 
Beispiel einer Tautologie ist der Ausdruck’: AA. 


Der Autor ıst sich bewußt, dass dıese Formel beı mathematisch nıcht besonders ambitionierten Leserinnen und Lesem eın 
gewisses Unbehagen auslösen kann. Es ıst allerdings auf dem Gebiet der EDV leider unvermeidbar, gelegentlich auf 
abstrakte Zusammenhänge und deren formale Schreibweisen zu stoßen. 

Dies ıst übrigens ein weiterer Grund, weshalb beı der Implikation aus etwas Falschem alles gefolgert werden kann: A => 
A ıst sıcherlich immer wahr, und dies soll auch so sein, wenn A selbst falsch ıst! 
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Mit Hilfe der Wahrheitswertetafeln kann man sehr rasch Zusammenhänge erkennen. 
Beispielsweise eilt dass die Formeln A>Bund- A vB äquivalent sind. 


Einige allgemein gültige Gesetze der Aussagenlogik seien nachfolgend aufgelistet, ohne dass 
diese hıer formal bewiesen werden sollen. 


Kommutativgesetze ArAB=BAA 
AvB=BvA 
Assoziativgesetze (AAB)AC=AA(BAC) 
(A vB)vC=Av(BvC) 
Distributivgesetze (AAB)vC=(AvC)A(BvC) 
(AvB)AC=(ArAC)v(BAC) 
Doppelte Negatıon — (-A)=A 
hebt sich auf 
Gesetze von DeMorgan -(ArAB)=-Av-B 


—(AvB)=-Ar-B 


1.2.2. Prädikatenlogik 


Es gibt allerdings auch Sachverhalte, die nıcht mit den einfachen Mitteln der Aussagenlogik 
beschrieben werden können. 


Ein Beispiel'” hierzu: Alle Unternehmer wollen Gewinne machen. Weil Herr Schmidt ein 


Unternehmer ıst, wıll er Gewinne machen. Diese Gedankenkette ıst ıntuıtiv sicherlich 
korrekt. 


Formuliert man aber ım Sınne der Aussagenlogik 
G := „Alle Unternehmer wollen Gewinne machen” 
U := „Herr Schmidt ıst ein Unternehmer” 

S := „Herr Schmidt wıll Gewinne machen” 


Dann ıst S ım Sınne der Aussagenlogik keine Konsequenz aus G und U, denn wir können 
zeigen, dass GA U > S nıcht allgemeingültig ıst. 


1% Zitiert nach [Beedgen], S. 89. 
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Die Wahrheitswertetafel zeigt (in der grau unterlegten Zeile), dass GA US keine 
Tautologie, also nicht immer wahr ist. 


Im Folgenden soll kurz ın die sogenannte Prädikatenlogik eingeführt werden, mit der solche 
Fragestellungen wıe die ım obigen Beispiel behandelt werden können. Die Prädikatenlogik 
ist gleichzeitig wesentliche Grundlage für die /ogische Programmierung, deren bekannteste 
Programmiersprache ProLog (Programmieren ın Logik) sein dürfte. 


Die Theorie der Prädikatenlogik wurde bereits zu Beginn des 20.Jahrhunderts gelegt; ın der 
Informatık eingesetzt wırd sie seit den Sechziger Jahren. 
Beispiele: 


l. Wır bringen „a ıst teurer als 3” zum Ausdruck. Dazu definieren wir uns ein sogenanntes 
Prädikat TEURER(a,b) mit der Bedeutung „a ist teurer als b”. [Eın solches Prädikat ıst 
gleichzeitig eine Relation. Vgl. hierzu das Kapitel zu relationalen Datenbanken (siehe 
S. 198).] 


2. Entsprechend kann man die Relation bzw. das Prädikat LIEFERT(a,b) einführen: 
LIEFERT(,Fa. Meıer”,’Kühlschrank”) steht dann für ‚Fa. Meıer liefert (einen) 
Kühlschrank”. 


Wir wollen einige fundamentale Begriffe der Prädıkatenlogik formal definieren. 
Eın Term kann wie folgt gebildet werden: 

l. Eine Konstante ıst ein Term. (Zum Beispiel: 5 oder „Kühlschrank”.) 

2. Eine Variable ıst ein Term. (Eine Variable ıst ein Platzhalter wie z.B. a.) 


3. Ist f eine Funktion mit n Argumenten, eine sogenannte n-stellige Funktion, und sınd aı, 
95, ..., A" Terme, dann ist f(a1,2>,...,a.) ein Term. 
(LIEFERT() ıst eine zweistellige Funktion, sınd a und b Variable und damit auch Terme, 
so ıst LIEFERT(a,b) wiederum eın Term.) 


Eın Prädikat P ıst eine Abbildung (Funktion), die einem n-Tupel von Konstanten genau einen 
der Wahrheitswerte w(ahr) oder f(alsch) zuordnet. 


Gemäß dieser Definition ıst TEURER() ein Prädikat, denn je zwei konkreten Dingen 
(Konstanten) wird eindeutig w oder f zugeordnet: TEURER (, Auto”, ‚„PC”) ıst entweder wahr 
oder falsch, sofern „Auto” und „PC” für zwei konkrete Dinge (Konstanten) stehen. 
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Ausdrücke werden wie in der Aussagenlogik verknüpft; hinzu kommen aber zwei weitere 
Symbole (Ouantoren) zur Spezifizierung von Variablen, der Allquantor V und der 
Existenzquantor 3. Mit diesen können Aussagen wıe „Alle ... sınd ...” oder „Es gibt ...” 
formalisıert werden, z.B. lässt sich „Alle Unternehmer wollen Gewinne machen” 
formalısıeren ın der Form Vx: (x ıst Unternehmer > x will Gewinn machen). Entsprechend 
ist „Es gibt PCs, die sind teurer als DM 5000” formal zu schreiben als 3x: (x ist PC A 
TEURER(x,5000)). 


Wendet man die allgemeine Aussageform 

Vx: (x ist Unternehmer > x wıll Gewinn machen) 
an auf einen konkreten Unternehmer, erhält man eine konkrete Aussage: „Schmidt ıst 
Unternehmer” > „Schmidt wıll Gewinn machen”. 


1.3. Zahlensysteme 


Die Daten (bzw. Informationen), dıe bei einer DV-Anlage verwaltet werden müssen, werden 
digital abgespeichert, das heißt präziser: als eine Folge von Elementen, die jeweils O0 oder 1, 
wahr oder falsch, Strom leitend oder nıcht leitend (usw.) sind; diese binäre Abspeicherung 
kann man sich vereinfacht als Folge von Nullen und Einsen vorstellen, ohne dass man sıch 
um die physikalischen Gegebenheiten dieser Abspeicherungen kümmern müsste. 


Natürlıch setzen sich komplexere Informationen aus einer Vielzahl solcher O-1-Bausteine, 
Bits genannt, zusammen. Zur Systematisierung dieser Informationen werden sogenannte 
Codes verwendet, dıe es ın einheitlich genormter Weise erlauben, u.a. das gesamte Alphabet 
abzuspeichern. Zum späteren besseren Verständnis dieser Codes machen wir zunächst einen 
Ausflug ın die Welt der Zahlensysteme 


Eine einfache Ja/Nein-Entscheidung kann offenbar durch genau ein Bit abgespeichert 
werden, indem z.B. festgelegt wird, dass 1 für „Ja” und O für „Nein” stehen soll. Hıer spricht 
man vom Informationsgehalt 1 Bit. 


Nimmt man zweı Bit Speicherplatz her, so können offenbar gerade die vier Kombinationen 
00, 01, 10 und 11 DV-technisch abgespeichert werden, d.h. mit 2 Bit können vier 
verschiedene Zustände dargestellt werden. Entsprechend dienen drei Bit zur Abspeicherung 
von acht (=2°) verschiedenen Möglichkeiten, die schematisch dargestellt werden können als 
000, 001, 010, 011, 100, 101, 110 und 111. 


In naheliegender Weise wırd man dıese acht O-1-Trıpel (häufig) als 0, 1, 2, 3, 4, 5, 6 und 7 
interpretieren. Dabeı spricht man vom Zweiıersystem (Dualsystem);, ähnlich dem gewohnten 
Zehner- oder Dezimalsystem handelt es sich dabei um eın Stellenwertsystem: während beim 
Zehnersystem die Potenzen von 10 durch eigene Stellen dargestellt werden (1, 10, 100, 1000 
usw.), sind es beim Zweıersystem die Potenzen von 2 (1, 2, 4, 8, 16 ...). Die duale Zahl 110 
steht auf diese Weise für 1:2°+1:2'+0:1 = 14+1:2+0:1 = 6 dezimal. Weitere Rechenübungen 
können auf Wunsch durchgeführt werden. 


Es dürfte unmittelbar einleuchten, dass aufgrund der binären Abspeicherungsmethodik ın der 
Datenverarbeitung das Dualsystem das dem Problemkreis angemessene Zahlensystem ist. In 
Kreisen hartgesottener Programmierer werden jeweils 4 Bıt (16 Möglıchkeiten) zu Einheiten 
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zusammengefasst, die mit dem Aexadezimalsystem (Sechzehnersystem) gut beschreibbar 
sind. 


Soll beispielsweise eine Schulnote gespeichert werden, so sind drei Bit notwendig, da mit nur 
zwei Bit lediglich vier verschiedene Alternativen dargestellt werden könnten; in gewissem 
Sınn werden hierbei allerdings (zwangsläufig) zwei Möglichkeiten „verschenkt”. 


Um das Alphabet der deutschen Sprache mit seinen je 26 Klein- und Großbuchstaben, je 3 
großen und kleinen Umlauten (usw.) sowie einer ganzen Reihe von Sonderzeichen (wie 
Klammern und Satzzeichen) abspeichern zu können, werden somit mindestens 6 oder 7 Bit 
benötigt (2°=64, 2’=128). Als Standard hat es sich durchgesetzt, dass 8 Bit, d.h. die 
Möglichkeit, 256 Alternativen abspeichern zu können, als ein Byre bezeichnet werden. 


0 [0 Jo To Jo Jo Jo Jo 0 [0 Jo [ı Jo Jı Jı Jo, 


Eın Byte. Eın anderes Byte. 


Das Rechnen ın anderen Stellenwertsystemen als dem uns gewohnten Zehnersystem ist 
generell genauso schwer oder leicht, nur natürlich nıcht so gewohnt. Eine Addition ım 
Zweiersystem funktioniert nach dem gleichen Ablaufprinzip, das wır ın unserer Kindheit 
einst für das Zehnersystem lernen durften. 


dual: a | dezimal: 7 
+ 1001 c, 9 

Übertrag I 1 11 
Ergebnis: 10000 16 


So, wıe man es sıch bei Zucker und Mehl angewöhnt hat, 1000 Gramm als eın Kilogramm zu 
bezeichnen, werden ın der DV-Welt 1024 Byte als ein KiloByte (kurz KByte, KB oder K) 
bezeichnet. Der zunächst etwas merkwürdige Wert 1024 ergıbt sich aus dem Zweiersystem:! 
1024 = 21). 


Dennoch ıst es natürlich umgangssprachlich legitim, bei einem KıloByte von (etwa) „tausend 
Bytes” zu sprechen. Ein Vergleich am Rande: eine Schreibmaschinenseite Text wırd, grob 
gemittelt, häufig mit 2000 Bytes =2 K angesetzt. 


Konsequent geht es dann weiter: 1024 KiloByte werden als ein MegaByte (kurz MB), 1024 
MegaByte (1.048.576 KıloByte) als eın GigaByte (GB) bezeichnet. 


1.4. Einführung in die Codierungstheorie 


Für die Speicherung und Übertragung von Daten (Nachrichten) ist es bei Nutzung der 
Digitaltechnik wichtig, eine entsprechende technische Darstellung - eine sog. Codierung - zu 
wählen. Anders als bei analogen Techniken können hier nicht “beliebig viele” Zwischen- 
werte gespeichert, jeder Zustand muss eindeutig beschrieben (“codiert”) werden. 


'! Hierbei wird allerdıngss nur der Informationsgehalt des puren Textes berücksichtigt. Modeme Text- 
verarbeitungsprogramme wıe Lotus Word Pro, StarWriter oder Corel WordPerfect speichern ın der Regel wesentlich 
mehr Informationen, weshalb die abgespeicherten Textdateien wesentlich größer sind. Vgl. hierzu dıe Betrachtung auf 
Seite 39. 
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In diesem Kapitel wollen wir einige grundlegende theoretische Aspekte aus der 
Codierungstheorie behandeln, im darauffolgenden Kapitel wırd dann eine Reihe konkreter 
Anwendungen diskutiert werden. 


1.4.1. Definitionen zur Codierung 


Unter einer Codierung versteht man mathematisch betrachtet eine umkehrbare Zuordnung 
aus einer Grundmenge G ın eine Zielmenge Z. Dabei steht G ın unserem Kontext für die 
“eigentlich interessante” Menge von Informationen, Daten, Nachrichten, während Z die 
DV-konforme Abspeicherungsform darstellt. 


Die ın der Praxis der Datenverarbeitung auftretenden Mengen G und Z bestehen aus allen 
möglichen (endlichen) Sequenzen von Zeichen aus bestimmten (endlichen) Alphabeten A 
und B. Mit A* werden dann alle endlichen Folgen von Zeichen aus der Menge A 
gekennzeichnet”. Wir formulieren deshalb die nachfolgende Definition bereits in dieser 
etwas engeren Form (und nıcht für beliebige Mengen G und Z). 


1.4.1.1. Definition (Codierung, Decodierung, Code) 


a) Es seien A ein endliches Ausgangs- und B eın endliches Ziel-Alphabet gegeben. Dann 
heißt eine umkehrbare (injektive) Abbildung c : A* > B* eine Codierung. 


b) Die Menge c(A*) wird Code oder Coode-Menge genannt. 


c) It s=a1an...an eA*, so wird c(s)=c(aı)c(a2)...c(an) e B* definiert. Für eine solche 
endliche Folge s von Elementen aus A wird c(s) als Codewort bezeichnet. 


d) Die lokale Umkehrabbildung d: c(A*) > A* mit d(c(a)) za VaeA wırd Decodierung 
genannt. 


e) Eine Codierung wird homomorph genannt, wenn sich die Codierung eines Wortes (also 
einer Sequenz von Zeichen) als Sequenz der Codierung der einzelnen Zeichen ergibt. 


Mit einer Codierung wird also jedes Wort, d.h. jede endliche Folge von Elementen aus A, auf 
genau eine endliche Sequenz von Elementen aus B abgebildet; es muss jedoch nicht jede 
endliche Folge von B-Elementen auch vorkommen; mathematisch: dıe Codierungsvorschrift 
muss zwar injektiv, nicht aber surjektiv bzw. bijektiv sein'®. 


Die Forderung der Homomorphie besagt, dass wır zeichenweise codıeren können. Dies 
erscheint zunächst als absolut selbstverständliche Forderung, wır werden jedoch später sehen, 
dass es auch gute Gründe geben kann, davon abzuweıchen. 


12 Wer sich für diese Begrifflichkeiten aus formaler Sicht interessiert, findet entsprechende Definitionen ım Kapitel zur 
Theoretischen Informatik; ın 6.2.1.1. (S. 127) werden die Begriffe “Alphabet” und “Menge aller Worte” präzise definiert. 

3 Surjektiv bedeutet, dass alle Elemente der Zielmenge auch beı der Abbildungsvorschrift vorkommen; bijektiv heißt eine 
Abbildung, wenn sıe injektiv und surjektiv ıst. 
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1.4.1.2. Beispiel (Morse-Code) 


Beim bekannten Beispiel des Morse-Codes'* wird das Alphabet A = { a, .., z } auf 
Sequenzen von Punkten und Strichen abgebildet, also Z= B* mıtB:={°’,°‘-}. 


Beispielsweise wird das Zeichen i auf die Sequenz “. .” abgebildet, das Zeichen s wird durch 
“. ...” dargestellt. Damit folgt: c(ilı) = c(ss), so dass keine Umkehrbarkeit auf Wortebene 
vorliegt! (Zeichenweise ıst diese natürlich gegeben.) 


Der Morse-Code wird also formal dahingehend erweitert, dass Pausen eingelegt werden, ın 
das Zıelalphabet also ein drittes Zeichen (Leerzeichen) mit aufgenommen wird. Dann ist die 
MengeB :={ °’,‘-,°“ und c(iii)=“.......” ist von c(ss) =“... ...” unterscheidbar’”. 


Mit der sogenannten Fano-Bedingung wird die wortweise Invertierbarkeit sıchergestellt. 


1.4.1.3. Fano-Bedingung 


Ist kein Codewort Anfangswort eines anderen Codewortes, dann kann jede Zeichenkette aus 
c(A*) auch dekodiert werden. 


Weitere Beispiele für konkrete Codes werden wir ım nächsten Kapitel kennenlernen; erwähnt 
seı an dieser Stelle bereits der Code “ASCIT’” zur Darstellung von Zeichen auf einem 
heutigen digitalen Rechnersystem (vgl. S. 36). 


1.4.2. Redundanz von Codes 


Codierungen von einzelnen Zeichen können auch mehrere Zeichen (des Zıelalphabets) 
umfassen, dies haben wir im obigen Beispiel des Morse-Codes bereits gesehen. 


Allgemein spielt die sogenannte mittlere Wortlänge eine Rolle. 


1.4.2.1. Definition (mittlere Wortlänge) 


Gegeben seien ein Ausgangsalphabet A, ein Zielalphabet B und eine homomorphe 
Codierungsvorschrift c: A*>B*. Als mittlere Wortlänge des Codes wird definiert: 
L:= X pili, wobei /; die Wortlänge des codierten (i-ten) Zeichens ist und p; die zugehörige 
Auftrittswahrscheinlichkeit (oder relative Häufigkeit). Die Summatıon läuft über alle Zeichen 
des Alphabetes A. 


_ Wir vereinfachen hier dıe Darstellung ein wenig. 
5 Wir wollen an dieser Stelle den mathematischen Formalısmus nicht weiter diskutieren, denn der aufmerksame Leser oder 
dıe aufmerksame Leserin wırd bemerkt haben, dass die formale Beschreibung modifiziert werden müsste! 
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1.4.2.2. Beispiel (mittlere Wortlänge) 


Es seien A:=1w,x,y,‚z} und B:=10,1}. Die Abbildungsvorschrift c werde wıe folgt 
definiert. 


c(w) :=00, c&) :=01, cQ) :=10,c(z) :=11. 

Die Auftrittswahrscheinlichkeiten der vier Elemente von A seıen alle gleich und somit 0.25. 
Dann berechnet sıch die mittlere Wortlänge dieses Codes zu: 
L=Lpili=0.25-2+0.25-2+025-2+025-2=2. 


Das ist natürlich keine besondere Überraschung, denn alle Codierungssequenzen haben die 
Länge 2. 


Modifizieren wir die Vorschrift und betrachten die Kodierung X ı wie folgt. 

kı(w) :=0, kı(x) := 10, kı(y) := 101,kı(z) := 111. 

Dann berechnet sıch die mittlere Wortlänge wıe folgt: 
L=X&pili=025-1+0.25-2+0.25-3+0.25-3=2.25. 

Die so gewählte Codierungsvorschrift erfüllt jedoch nicht dıe Fano-Bedingung. (Warum?) 
Daher wollen wir eine weitere Beispielcodierung betrachten: X3 definiert durch 

kı(w) :=0, ka(x) := 10, ka(y) := 110,kalz) := 111. 


Sınd wıederum alle Auftrittswahrscheinlichkeiten ınnerhalb der Menge A gleich, so ergibt 
sich auch hier dıe mittlere Wortlänge von 2.25. 


1.4.2.3 Information und Entropie 


Aus der Informationstheorie'° ist der Begriff der Information bekannt. Für den sogenannten 
Informationsgehalt'’ J eines Zeichens” wird gefordert: 


a) Je seltener ein Zeichen auftritt, desto größer ıst der Informationswert des Zeichens. Also: 
desto kleiner die Auftrittswahrscheinlichkeit » des Zeichens ıst, desto höher ist die 
Information J. 


b) Die Information einer Zeichenkette soll sich aus der Summe der Einzelinformationen 
ergeben: J(aıa2...an) =J(aı) +Jla2) +... +J(an). 


c) Spezialfall: wäre die Auftrittswahrscheinlichkeit eines Zeichens 1, dann soll die 
Information 0 sein. 


1° Vgl. hierzu etwa [Emst], S. 54 ff. 
1" Wır schreiben der besseren Lesbarkeit wegen J statt des ansonsten üblichen I. 
18° Analog lässt sıch dıes auch für Worte - also Zeichenketten - definieren. 
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Die mathematisch einfachste (übliche) Funktion, die diese Eigenschaften besitzt, ıst der 
Logarıthmus. Daher wird als Informationsgehalt (oder kurz Information) eines Zeichens 
definiert'”: 


Ka) = 10g,(55) = ld 75) = -Id(p(a)) 


Als Entropie H einer Nachricht - also einer endlichen Sequenz von Zeichen - wird der 
mittlere Informationsgehalt definiert: 


H(a1an...a,) = Lpla)-Ja)= &pla;): Rlerens)‘ Summatıon über i von / bis n. 


Maximal wird die Entropie dann, wenn alle Auftrittswahrscheinlichkeiten ım 
Ausgangsalphabet gleich sind. In diesem Falle ist 7=%) +  /d(n) = Id(n). 


Generell gilt gemäß dem Shannonschen Codierungstheorem stets A7<L1/. 


Das bedeutet für die Praxis: ıst die Entropie gleich der mittleren Wortlänge des 
zugrundeliegenden Codes, so kann beı der Codierung nichts “verbessert” werden ım Sınne 
einer eventuellen kürzeren Darstellung. Ist jedoch die Entropie kleiner, so kann eine 
kompaktere Codierung gefunden werden, sofern man nicht eine zeichenweise Codierung 
erzwingt. Dies ıst der Ansatzpunkt für Kompressionsverfahren und führt zur Definition der 
Redundanz. 


1.4.2.4. Definition (Redundanz) 


Für einen gegebenen Code wird dessen Redundanz R definiert durch R := L - H, also als 
Differenz von mittlerer Wortlänge und Entropie. 


1.4.2.5. Beispiel (Redundanz) 


Gegeben seı das Alphabet A :=1x,y,z }. Codiert werde wıeder ın Form von Bitfolgen, das 
Alphabet B bestehe also wıeder aus O und 1. Dann ıst ein konkretes Beispiel einer Codierung: 


c&) =1,c) :=0Ol,c(z) :=00. 


Die Auftrittswahrscheinlichkeiten oder -häufigkeiten der drei Zeichen seien 5, 4 und +. 
Dieser Code hat daher eine mittlere Wortlänge vonL=3-1+3-2+4-2=7=15. 


Die Entropie (bezogen auf ein Wort, bei dem jedes Zeichen genau einmal vorkommt, also 
etwa “xyz’) berechnet sıch zu: 


H(xyz) = p(x) IX) + po) Jo) +p(z) -I(z) = 5 ld(2) + Zld(4) + 2ld4)=5+7+3=5=15. 


Das heißt dıe Redundanz ın dieser Sıtuation ıst?*=1L-H=0. 


7 ]d steht für logarıthmus dualıs, den Logarithmus zur Basis 2. Dieser wırd verwendet, weil man üblicherweise möchte, 
dass der Informationsgehalt bei dem “digitalen Grundszenario” von zwei möglichen Zeichen (0 und 1) mit gleicher 
Wahrscheinlichkeit (=0.5) für ein Zeichen gerade | seın soll. Ansonsten wäre aber auch jede andere Basıs für dıe 
Logarıthmusbildung möglich. 
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Wären die Auftrittswahrscheinlichkeiten gleich, also > für jedes Zeichen, dann ergäbe sıch 
folgendes Bild: 

Mittlere Wortlänge: L=+-1+4:2++:2=221.66, 

Entropie: H(xyz) = p(x) - J@x) + pP) - Jo) + p(z) - J(z) = ld(3) = 1.59, 

Redundanz: R=L-H 20.017. 


Dies bedeutet: die 0.g. Codierung ıst nıcht ganz redundanzfrei, dıes kann aber auch nicht auf 
der Ebene einzelner Zeichen bei Verwendung eines zwei-elementigen Zielalphabetes erreicht 
werden. Entweder nutzt man einen (z.B.) drei-elementiges Zielalphabet oder man codiert 
ganze Zeichenketten, wenn man die Redundanz auf O bringen möchte. 


Generell versucht man zunächst einmal, Redundanz wo möglıch zu vermeiden; umgekehrt 
dient diese aber zur Erhöhung von Übertragungs- oder Speicherungssicherheit, da mit 
geeigneten Codes bestimmte Fehler erkannt oder sogar korrigiert werden können. Darauf 
gehen wır nachfolgend etwas näher ein. 


1.4.2.6. Code-Bäume 


Um eine auftretende Code-Redundanz zu vermindern können Codes mit varıabler Wortlänge 
aufgebaut werden, womit auf die unterschiedliche Verteilung der Ausgangszeichen Rücksicht 
genommen werden kann. 


Hilfsmittel zur Betrachtung solcher Codes sınd sog. C'ode-Bäume. Greifen wır auf obiges 
Beispiel zurück [c(x) :=1,c(y) :=0Ol,c(z) :=00], dann können wir dies graphisch wıe folgt 
darstellen: 


Ein Code ıst gut geeignet (d.h. mit möglıchst geringer Redundanz), wenn der zugehörige 
Code-Baum keine ungenutzten Blätter besitzt (wıe es hıer der Fall ıst) und dıe kürzeren Wege 
stets für Worte mit höherer Auftrittswahrscheinlichkeit genutzt werden. Das bedeutet hier ım 
Beispiel: dıe relative Auftrittshäufigkeit der Codierung “1” darf nıcht kleiner seın als die von 
“00” oder “O1”; wäre dies so, dann wäre ein Vertauschen der beiden Codierungen sınnvoll. 


Betrachten wır dazu dıe folgende Codierung k - der Einfachheit halber wıeder über dem 
kleinen Alphabet4 :=!x,y,z }. Es sei: k(x) := 11,k(y) := 101,%k(z) := 100. Dann sıeht der 
zugehörige Code-Baum wie folgt aus, wobei der nicht genutzte Teil links nur angedeutet ist. 
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100 101 


Seien die Auftrittswahrscheinlichkeiten wieder >, 4 und 4 für x, y und z bzw. 11, 100 und 


101. Dann hat der Code eine mittlere Wortlänge vonL=3-2+2-3+47-3=2=25, 


Die Entropie berechnet sich natürlich wiederum zu 
H(xyz) = p(x) - IX) +PQ) I) + Plz) - Je) = 5: 1d(2) + Zld(4) + Fld(A)=3+3+3=3=15. 


Das heißt die Redundanz ın dieser Situation ıst R=L-H =]. Offensichtlich ıst diese 
Codierung nicht optimal, durch ein Nutzen des linken Teilbaumes (“Beginn mit dem ersten 
Zeichen 0”) kann - wıe oben dargestellt - die Redundanz auf 0 gesenkt werden. 


1.4.2.7. Huffman-Algorithmus 


Auf der Suche nach einem Verfahren, wıe ein optimaler Code-Baum aufgestellt und somit 
die Redundanz minimiert werden kann, gibt der Huffman-Algorıthmus die Antwort. 


Alle auftretenden Zeichen werden nach aufsteigender Wahrscheinlichkeit sortiert. Die beiden 
Zeichen mit den kleinsten Wahrscheinlichkeiten pı und p> werden zu einem Knoten 
zusammengefasst, der mit der Wahrscheinlichkeit pı + p2 bewertet wırd. Damit erhält man 
eine neue Sequenz von Wahrscheinlichkeiten (für Zeichen bzw. Knoten), dıe man auf 
dieselbe Weise behandelt, bis schließlich nur noch eın Knoten übrig ist. Es ıst erwiesen, dass 
es keinen günstigeren Code gibt, der auf der Codierung von Einzelzeichen beruht, als der auf 
dem so ermittelten Huffman-Baum beruhende Code. 


Sehen wir uns dies ın einem kleinen konkreten Beispiel an. 


Betrachten wir das Alphabet A :={a,b,c,d } mit den Auftrittswahrscheinlichkeiten 0.4, 0.3, 
0.2 und 0.1. Dann berechnet sıch die Entropie zu 


H =0.4-ld(z) +0.3 - Id(53) + 0.2: ld(55) +0.1- Id(<-) = 1.846. 


Codieren wır diese vier Zeichen einfach über die Sequenzen 00, Ol, 10 und 11, was eın 
naheliegender Ansatz sein könnte, dann erhielten wır logischerweise die mittlere Länge 2: 


L=0.4-2+0.3-2+0.2-2+0.1-.2=2. 
Die Redundanz liegt hier also bei *=L-H 0.154. 


Bauen wir nun jedoch den Huffman-Baum nach obigem Muster auf: dann bündeln wir zuerst 
dıe Codierung für c und d zu einem Knoten mit der Gesamtwahrscheinlichkeit 0.3; an- 
schließend wird dieser Knoten gemeinsam mit dem b zu einem weiteren Knoten 
zusammengefasst, dıe Wahrscheinlichkeit an diesem Knoten beträgt nun 0.6; schließlich ist 
das a noch übrig als Alternative mit der relativen Auftrittshäufigkeit 0.4. Das heißt: bis auf 
Spiegelung sıeht der Huffman-Baum wie folgt aus. 


d 0.1 c0.2 Länge 3 


b 0.3 Länge 2 
0.3 


a0.4 Länge 1 
0.6 


1.0 


Wird nach lınks die “0” und nach rechts dıe “1” aufgetragen, ıst der Baum so zu 
interpretieren: das ‘a’ wird codiert durch “1”, das ‘b’ durch “O1”, das ‘c’ durch “001” und das 
‘d’ durch “000”. Die mittlere Länge 7 berechnet sıch ın diesem Fall zu: 


L=0.1-3+02-3703-.2204:1=12. 


Die Redundanz liegt hier also bei R=L-H=0.1. Das bedeutet: über größere Datenmengen 
gerechnet sparen wır mit dieser Codierung Platz! 


1.4.3. Fehler bei Speicherung und Übertragung 


Da auch ein DV-System nıcht perfekt ist, treten mitunter Fehler bei der Speicherung oder 
Übertragung von Daten (Information, Nachrichten) auf”. 


Geht es um eine Ja-Nein-Frage, dıe entsprechend ohne Redundanz mit O oder 1 codiert wird, 
so gibt es “kein Pardon”: trıtt hier ın nur einem Bit ein Übertragungsfehler auf, so ıst die 
Antwort definitiv falsch - und sıe kann grundsätzlich nıcht als falsch erkannt werden! 


?° Aus Sicht der Codierungstheorie ist es letztlich unwichtig, ob wir über Probleme bei der Speicherung oder Übertragung 
sprechen, da es ın beiden Fällen auf die Rekonstruktion der ursprünglichen “korrekten” Daten aus einer eventuell 
“korrupten”, fehlerbehafteten Datenmenge ankommt. 
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Daher nımmt man ın der Praxis Redundanz ganz bewusst ın Kauf (bis zu einem gewissen 
Grad), denn nur so können Fehler erkannt - oder vielleicht sogar vollautomatisch korrigiert - 
werden. 


1.4.3.1. Einige Code-Beispiele 


Betrachten wır die folgenden Beispielcodierungen über dem schon bekannten übersichtlichen 
Alphabet A =! a,b,c,d }. 


a) Cl: cı(a) :=00, cı(b) :=01, cı(c) := 10, cı(d) = 11; 

b) C2: ca(a) :=000, ca(b) :=0Ol1, ca(c) := 101, ca(d) := 110; 

c) C3: c3(a) :=0000, cı(b) :=0101, cı(c) := 1010, cı(d) := 1111; 
d) CA: cı(a) :=1, cı(b) :=01, cı(c) :=001, cı(d) := 000. 


Treten bei Code C1 (bitweise) Übertragungsfehler auf, so ist “nichts zu machen”, d.h. es 
kann keın Fehler analysiert werden, weıl jede Bitfolge eine gültige Codierung repräsentiert. 


Anders bei Codierung C2. Offenbar werden hier mehr Bits als eigentlich notwendig für die 
vier verschiedenen Möglichkeiten eingesetzt. Im konkreten Fall ıst das dritte Bit stets so 
gewählt, dass dıe Summe aller Bits (modulo 2 gerechnet) O ergibt; anders formuliert: dıe 
Quersumme ist gerade bzw. (modulo 2 gelesen) 0. Tritt hier ein einzelner Bitfehler auf, trıtt 
beispielsweise dıe Sequenz 111 auf, so kann sofort festgestellt werden, dass dıese Belegung 
ungültig ıst. Allerdings kann sıe nicht automatisch korrigiert werden, denn es könnte seın, 
dass bei 101 versehentlich das mittlere Bit fehlerhaft übertragen worden ıst oder beı 110 das 
letzte. 

Man spricht bei den durch die Codierung verwendeten Sequenzen, hier z.B. Oll, von 
Nutzwörtern, ım Gegensatz dazu heißen dıe nıcht verwendeten Sequenzen wie ın diesem Fall 
etwa 010 Fehlerwörter. 


Sehen wir uns die “spendable” Codierung C3 an. Hıer werden doppelt so vıele Bits genutzt 
wıe nötig wären. In diesem sımplen Fall wırd das 2-Bit-Muster aus Codierung Cl einfach 
gedoppelt. Tritt hier nun ein 1-Bit-Fehler auf, etwa 1Oll, so kann wıederum der Fehler als 
solches festgestellt werden. Interessanterweise kann aber auch hier der Fehler nıcht 
maschinell korrigiert werden, denn die fehlerhafte Sequenz kann durch eine 1-Bit- 
Abweichung von 1010 oder von 1111 resultieren! 


Codierung C4, die wır ım vorherigen Unterkapitel im Kontext des Huffman-Baumes 
kennengelernt haben, bereitet uns überhaupt keine Freude, denn wird eine Sequenz der Art | 
001 O1 übertragen und tritt hierbei ein Bitfehler auf - beispielsweise 1 Oll Ol -, so ıst “fast 
nıe” ein Fehler festzustellen, da nahezu alle Sequenzen gültig sind. Lediglich sınguläre 
Ausreißer wıe die Muster 00 oder 00000 könnten als Fehler erkannt werden, wobeı wiederum 
fraglıch bleibt, was das ursprünglich korrekte Ausgangsmuster gewesen sein soll. 
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Um das Ganze etwas systematischer anzugehen wieder - Sıe ahnten es schon - einige formale 
Definitionen. 


1.4.3.2. Definition (Stellendistanz, Hamming-Distanz) 


a) Gegeben seien zwei gleichlange Zeichenketten s, / über demselben Alphabet A. Dann wird 
als Szellendistanz d(s,t) dıe Anzahl der unterschiedlichen Bits auf den jeweiligen 
Positionen von s und 7 bezeichnet. Mathematisch: 

d(s,!) =Hi|s; #1, I<isn}, s=sıs2...s,, t=Tıla...tn. 


b)Es sei c: A*>B* ein homomorpher Code, der für einzelne Zeichen aus A stets 
gleichlange Codewörter liefert. Das heißt, diese Codierung kann auch als c: A>B 
aufgefasst werden, da wegen der Homomorphie hierdurch der komplette Code bereits 
definiert ıst. 
Die Hamming-Distanz dp eines solchen Codes c : A* > B* bzw. c: A> Bist definiert als 
die kleinste auftretende Stellendistanz zweier Codewörter von c. 
Mathematisch: dyr(c) :==mın! d(c(aı),c(a>)) |aı,a2 € A, aı #aa } 


Betrachten wır dıe beiden Bitmuster s :=0011 und 7:=0100, dann ıst dıe Stellendistanz 
d(s,t)=3. Für die Codierung C2 aus dem obigen Beispiel ergibt sich die Hamming-Distanz 
dy(C2)=2, denn je zwei Codewörter sınd um genau zwei Bits verschieden. (Bitte 
nachrechnen!) 


Auch für die o.g. Codierung C3 ist die Hamming-Distanz dy(Ü3) = 2, auch wenn es einzelne 
Bitmuster gıbt, die eine Stellendistanz von 4 zueinander besitzen. 


Natürlich ist die Hamming-Distanz eines jeden Codes mindestens gleich 1, da ansonsten zwei 
verschiedene Zeichen aus A (oder Worte über A) auf dasselbe Ergebnis abgebildet würden. 


Es gilt das allgemeine Resultat: hat ein Code C eine Hamming-Distanz dy(C) = h, so können 
Fehler (Abweichungen) von maximal h- 1 Bits erkannt und von maximal "5" Bits korrigiert 
werden. 


Damit ıst auch begründet, weshalb auch der obige Code C3 keine Fehlerkorrektur ermöglicht, 
denn hier ıst die Hamming-Distanz 2 und nach endlich langer Rechnung sıeht man: 
etc 

Sıe werden ım nächsten Kapıtel den BCD- und den ASCII-Code kennenlernen. Vielleicht 
überlegen Sıe sıch ın beiden Fällen, welche Hamming-Distanzen diese Codes besitzen? 


1.4.3.3. Prüfziffer-Systeme 


Soll ein DV-System insbesondere Fehler bei der Eingabe - etwa von numerischen Angaben 
wıe Konto- oder Artikelnummern - erkennen und zurückmelden können, dann wırd ın der 
Regel eın Prüfziffernsystem eingesetzt. Der Code C2 aus dem vorherigen Beispiel 1.4.3.1. 
nutzt eine ganz einfache Prüfziffer: dıe sogenannte Parität. 
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Andere Beispiele sind etwa die zehnstelligen /SBN von Büchern, bei denen die ersten neun 
Stellen (aus dem Bereich von O0 bis 9) gemäl3 der nachstehenden Formel miteinander 
verrechnet und um eine Prüf-”Ziffer” p aus dem Bereich von O bis 10 ergänzt werden. Im 
speziellen Fall »=10 wird ein ‘X’ notiert. p ıst so zu bestimmen, dass 


(10aı + 9a2 + 8Sa3 + Tas + 6a5 + 5as +4ar +3as +2a9 +p) mod11=0 
gilt. 


Ähnlich geht man beim einheitlichen Kontonummernsystem EKONS vor. Hier wird eine 
neunstellige Ausgangssequenz a1q2...49 um eine Prüfziffer p aus dem Bereich O bis 9 so 
ergänzt, dass 


(2aı ta2 +2a3 tay+2as +tas +2a7 tags +2a9 +p) mod10=0 


gilt. 


1.4.3.4. m-aus-n-Codes 


Als m-aus-n-Code (für natürliche Zahlen m und n mit m < n) bezeichnet man Block-Codes, 
bei denen jeweils genau m der n Bits auf | gesetzt werden. 


Beispielsweise stellt dıe nachfolgende Zuordnungsvorschrift von A :=10,1,...,9} ın die 
Menge B der 5-Bit-Sequenzen einen 2-aus-5-Code dar. 


c(0) = 00011, c(1) :=00101, c(2) := 00110, c@) := 01001, c(4) := 01010, 
c(5) = 01100, c(6) := 10001, c(7) := 10010, c(8) := 10100, c(9) := 11000. 


Hierbei haben zweı Nutzwörter stets eine Distanz von mindestens 2, so dass die 
Hamming-Distanz eines solchen Codes 2 ist“. Damit können bei m-aus-n-Codes 1-Bit-Fehler 
stets erkannt, jedoch nıcht generell korrigiert werden. 


Generell gibt es gerade („,) verschiedene nutzbare Codewörter in einem m-aus-n-Code. 
(Weshalb?) 


1.4.3.5. Fehlerkorrigierende Codes 


Als fehlerkorrigierenden Code bezeichnet man einen Code, bei dem (mindestens) 
1-Bit-Fehler nicht nur erkannt, sondern sogar vollautomatisch korrigiert werden können. 
Detaillierter definiert man den Begriff des n-Bit-fehlerkorrigierenden-Codes, der eine 
gegebene Anzahl von n Bit-Abweichungen selbständig korrigieren kann. 


Als ein Beispiel eines solchen fehlerkorrigierenden Codes (für eine 1-Bit-Abweıchung) seı 
das Prinzip der “zweidimensionalen Prüfbits” ıllustriert. 


* Für die mathematische Präzision: Insbesondere gibt es auch zwei Nutzworte, die um eine Stellendistanz von 2 
auseinander liegen. 
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Block der eigentlichen Nutzdaten 


DE HE DR DR RR RE En 
DE HE U DE HE HE HE ER 
DE HE U DE DE HE ER ER ER 
DE HE U DE DE HE ER ER ER 


Prüfzeile 


pP 


Gemäß der obigen Skizze gibt es einen zweidimensional notierten Block von Nutzdaten 
(Menge einzelner Bits). Zeilenweise werden “rechts” ın einer sogenannten Prüfspalte 
Kontrollbits errechnet und gespeichert, z.B. so, dass dıe Zeilensumme modulo 2 stets gerade 
ist. Analog wırd spaltenweise verfahren und ein Kontrollbit wırd ın der Prüfzeile abgelegt. 
Schließlich gibt es ein einzelnes Prüfbit P, das einen entsprechenden Kontrollwert der 
Prüfzeile bzw. der Prüfspalte darstellt”. 


Tritt nun ın dem gesamten Block eine Abweichung von einem Bit auf, dann kann zunächst 
einmal festgestellt werden, dass eın Fehler aufgetreten ıst. Anhand der (logischen) 
zweidimensionalen Struktur kann jedoch sogar der Ort der Abweichung ermittelt werden. 


Verschiedene Fälle sınd denkbar: 


a) Die Abweichung befindet sich im Nutzdatenblock. In diesem Falle weichen die Prüfbits ın 
der betreffenden Zeile und der betreffenden Spalte ab, dadurch sınd dıe Koordinaten 
bekannt und das betreffende fehlerhafte Bit kann automatisch invertiert werden. 


b) Befindet sich die Abweichung in der Prüfzeile, so wird ın der Prüfzeile eine 
Paritätsabweichung festgestellt, jedoch keine ın der Prüfspalte.e Nun kann durch 
spaltenweise Kontrolle festgestellt werden, welche Spalte fehlerhaft ıst: damit ıst die 
fehlerhafte Stelle ın der Prüfzeile gefunden, dıese kann wıederum selbständig korrigiert 
werden. 

Analog dazu ist der Fall einer Abweichung in der Prüfspalte. 


c) Schließlich könnte das “Gesamtprüfbit” P fehlerhaft sein. Da die Parıtätschecks der 
Prüfzeile und der Prüfspalte jedoch korrekt sind, wırd ın diesem Falle P als fehlerhaft 
erkannt, da es weder die Parıtät über dıe Prüfzeile, noch die über dıe Prüfspalte erfüllt. 


** Man sıeht leicht, dass bei einer korrekten Datenspeicherung das Prüfbit über die Prüfzeile stets dasselbe sein muss wie 
das über dıe Prüfspalte! 
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1.4.3.6. Fehlertolerante Codes 


Abschließend seı kurz auf dıe sogenannten /ehlertoleranten Codes hingewiesen. Darunter 
versteht man Codes, bei denen Abweichungen in ein oder wenigen Bits zwar nıcht erkannt 
werden (müssen), bei denen eine solche Abweichung jedoch in fachlicher Hinsicht nıcht 
gravierend ist. 


Insbesondere ım Kontext von Zahlencodes, also der Codierung von Zahlwerten, geht man 
dıesen Weg. Zahlencodes, bei denen “benachbarte” Bit-Sequenzen auch benachbarte Zahlen 
darstellen, nennt man Gray-Codes. 


Ein Beispiel für einen solchen Gray-Code für die Ziffern O bis 9 wird nachstehend aufgeführt. 


Wer mehr hierzu lesen möchte, seı auf das Buch von [Ernst], S. 77ff, verwiesen. 


1.5 Praktische Codierung: 
Zahlen, Zeichen, Dateien und Grafiken 


Nach den Einblicken ın die Codierungstheorie wollen wir uns nachstehend mit einigen 
praktischen Aspekten der Codierung befassen; exemplarisch behandeln wır Möglichkeiten 
der Zahlencodierung, der Codierung von einzelnen Zeichen, ganzen Dateien und - 
gewissermaßen als Spezialfall - von Grafiken. 


1.5.1 Codierung von Zahlen 


Neben der eingangs diskutierten Codierung von ganzen (positiven) Zahlen gibt es noch eine 
ganze Reihe anderer „Dinge”, die gespeichert, also auch codiert werden müssen. 


Beginnen wir mit der Abspeicherung verschiedener Arten von Zahlen ın sogenannten 
Zahlformaten. 


Das Prinzip (bzw. dıe Codierungsvorschrift oder das Format), eine übliche, nıchtnegative 
ganze Zahl (wıe etwa 12) einfach durch ıhre Dualentwicklung zu repräsentieren, nennt man 
„echte Dualzahl”. 


So ıst die Dezimalzahl 12 (eindeutig) zerlegbar ın die Dualentwicklung 124, = 8 + 4 = 
1%271Xx2#02 0X 2 =1100.4 


Das Format der echten Dualzahl eignet sich typischerweise gut für alle Arten von 
„Rechenaufgaben”, ın diesem Format rechnet der Computer selbst. 


Steht mehr die Ausgabeformatierung ım Vordergrund für Darstellungen auf einem 
Bildschirm oder Ausdruck, dann kann eine anderes Format gewählt werden: das sogenannte 
„unechte Dualzahlformat”. Hierbei wırd ım Falle der 12 nıcht der numerische Wert 12 dual 
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ermittelt und abgespeichert, vielmehr wird die Darstellung als Zeichenfolge ‘1’ ‘2’ auch 
intern abgespeichert. 


Die Zahl 12 wäre demnach als unechte Dualzahl abgespeichert dıe Folge der zwei 
ASCII-Zeichen” ‘1’ und ‘2’; ein Blick in eine ASCII-Tabelle‘' verrät, dass die ‘1’ den 
ASCII-Code Nr. 49, die ‘2’ die 50 besitzt. Wırd dies nun noch ın das Dualsystem 
umgewandelt, so entsteht die Darstellung der 12 als unechte Dualzahl”: 
0011 0001 0011 0010. 


Sıeht man sıch die (auf ASCH basıerenden) unechten Dualzahlen genauer an, dann stellt man 
fest, dass das obere Halbbyte stets 0011 lautet; dies könnte somit auch weggelassen werden, 
sofern der verarbeitenden Software „klar” ıst, dass es sıch beı den betreffenden Daten um das 
jeweils zweite Halbbyte einer solchen unechten Dualzahl handelt. 


Auf diese Weise gelangt man zur sogenannten „gepackten unechten Dualzahl”: die Zahl 12 
wäre somit zu speichern als nur noch zwei Halbbytes große Sequenz 0001 0010. 


Zu diesem Verfahren gelangt man auch, wenn man direkt dem Ansatz der sogenannten 
„BUD-Zahlen” (binary coded decimals) folgt: Für das Abspeichern einer Ziffer ım 
Zehnersystem sınd offensichtlich vier Bits notwendig, denn mit drei Bits kommt man nur 
gerade auf 2° = 8 Möglichkeiten. Somit ist ein naheliegender Ansatz, jeweils eine Ziffer des 
Dezimalsystems ın einer sogenannten Jefrade, also einer Sequenz von vıer Bits 
abzuspeichern. Damit sind die Sequenzen 0000, 0001, 0010, usw. bis 1001 „verbraucht” für 
dıe Ziffern ‘0’ bis ‘9°. Die restlichen sechs Möglichkeiten (1010 bıs 1111) werden nicht 
benötigt, hier spricht man daher von Pseudotetraden. 


Ein solcher BCD-Code (binary coded decimal) arbeitet nach diesem Tetraden-Prinzip”. Die 
mehrstellige Dezimalzahl 234 wäre somit darstellbar durch dıe Tetradensequenz 0010 0011 
0100. Und ın unserer vorherigen Sprechweise wäre dies eine gepackte unechte Dualzahl. 


Geht man weiter, so sınd als nächstes auch negatıve ganze Zahlen zu speichern. Dies 
geschieht dadurch, dass das höchste Bit, also das skizziert am weitesten lınks stehende, als 
sogenanntes Vorzeichenbit verwendet wird; es ıst O für Zahlen größer oder gleich O und 1 für 
negatıve Zahlen. 


Die bis hier diskutierten Zahldarstellungen kann man unter dem Begriff der Festkommazahl 
oder Festpunktdarstellung zusammenfassen, wenn man sıch folgende naheliegende 
Erweiterung vor Augen führt. 


Bislang haben wiır stets ganze Zahlen (wie etwa 12) dargestellt; mit derselben Technik könnte 
man aber ohne weiteres auch z.B. Zahlen mit einer festgelegten Anzahl Nachkommastellen 
codieren, wenn nur festgelegt ıst, wo das Komma stehen soll. Einıgt man sich beispielsweise 
auf zwei Nachkommastellen (wıe bei Preisangaben üblich), dann wäre die Zahl 12 (Mark 
oder Euro) als 1200 (Pfennig oder Cents etc.) zu speichern. Die Abspeicherung 


[85] 
Ws 


Hier verwenden wir bereits den Begriffs des ASCH-Codes, der erst auf Seite 36 ausführlicher behandelt werden wird. Im 
Moment ist lediglich notwendig zu wissen, dass jedes Zıfferszeichen (wıe etwa dıe ‘1’) durch einen eindeutigen (und 
zunächst willkürlichen) Code repräsentiert wird. 

Eine solche findet sıch zufällig ım Anhang dieses Skrıpts auf Seite 237. 

Ggf. ıst nachzurechnen: 49ge = 0011 000 1 aa SOgez TOOL 0010 auaı! 

Neben dem BCD-Code gibt es noch einige andere Tetradencodes, z.B. der Aıken- oder der Gray-Code. Auf diese soll 


[587 
> 


[587 
in 


[37 
[ex 


hier jedoch nıcht näher eingegangen werden; stattdessen seı auf [Dworatschek] S. 169 ff verwiesen. 
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0001 0010 0011 entspräche somit der Sequenz 1 2 3 (dezimal gelesen), und zusammen mit 
der Festlegung des Dezimalkommas stünde dies für 1,23 (eins komma zweı drei). 


Bei diesem Codierungsschema steht die Anzahl der Nachkommastellen und die der 
Vorkommastellen von Anfang an fest; ın unserem Beispiel können Zahlen nur bis zur 
zweiten Nachkommastelle „genau” gespeichert werden. Eine Zahl wıe etwa 1,2345 müsste 
zwangsläufig gerundet (als 1,23) abgespeichert werden. 


Nun gibt es aber auch Problemstellungen, bei denen nicht von vorne herein klar ist, ın 
welchen Größenordnungen und mit welcher Genauigkeit eine Zahl darzustellen ist. So ıst es 
gelegentlich erforderlich, auch die Zahlen 1.230.000 oder 0,0000000000000123 abzu- 
speichern. 


Hierzu dient die Gleitpunkt- oder Gleitkommadarstellung. Eine Zahl x wird mathematisch 
dargestellt als x = mxB°, wobei m als die Mantisse, B dıe Basis und e der Exponent (oder die 
sogenannte Charakteristik) bezeichnet wird. In der Regel wird als Basıs B der Wert 2 
gewählt. Eine Zahl x ıst somit zerleg- und darstellbar als x = mx2°. Für dıe Mantisse wird 
festgelegt, dass diese zwischen O0 (einschließlich) und 1 (ausschließlich) liegen muss. 


Dezimalzahl 


Festkommazahl Gleitkommazahl 
Echte Dualzahl Unechte Dualzahl 


Ungepackte Darstellung Gepackte Darstellung 


Damit wäre die Zahl x = 124. = 1100auaı = 0,1100ausı X 2° darstellbar mit Vorzeichen O (Zahl 
nıcht-negatıv), Mantısse 1100q..ı und Exponent 100quı = Asez. 


1.5.2. Codierung von Zeichen 


Während es beı einer ganzen Zahl wıe 0, 1 oder 2 nach dem bisher Gesagten nun klar sein 
sollte, wıe man diese auf einem bınär orientierten (digitalen) DV-System abspeichert, ıst dies 
bei einem Zeichen wıe ‘A’ keineswegs geklärt. Da der Digitalrechner, salopp formuliert, nur 
O und 1 als atomare Bausteine speichern kann, kann er intern „in Wahrheit” nur endliche 
Sequenzen von O und 1 darstellen. 
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Daraus resultiert die Notwendigkeit der Codierung. Unter einem Code versteht man ın 
dıesem Zusammenhang die Abbildung des darzustellenden Zeichenvorrates auf eine 
entsprechende Menge endlicher O-1-Folgen. 


Würde man nur die vier Zeichen ‘A’, ‘B’, ‘°C’ und ‘D’ speichern wollen, so könnte man einen 
2-Bit-Mini-Code vereinbaren, bei dem ‘A’ durch 00, ‘B’ durch 01, ‘C’ durch 10 und ‘'D’ 
durch 11 dargestellt werden. Der bekannte Automobilclub „ADAC” wäre dann sehr einfach 
darzustellen als Sequenz 00 11 00 10. Die beliebte Rockgruppe „AC/DC” wäre (ohne den 
Schrägstrich allerdings) darzustellen ın der Form 00 10 11 10. 


Die hier der besseren Lesbarkeit eingeschobenen Leerzeichen muss bzw. kann der Rechner 
natürlich nicht mitspeichern, dies wäre ja ein weiteres, fünftes Zeichen, das ın 2 Bit nıcht 
mehr hineinpasst. Solange aber die Breite (=Anzahl der Bits) eines Zeichens in einem 
bestimmten Code gleich ist”, benötigt man natürlich auch keine Trennmarkierungen 
zwischen den einzelnen Zeichen. 


In der Praxis benötigt man natürlich mehr Zeichen, und es wurden ın der Vergangenheit auch 
verschiedene Codierungen festgelegt. 


Es sei an dieser Stelle kurz erwähnt, dass es noch zahlreiche weitere Codierungsformen gibt, 
u.a. auch fehlererkennende und fehlerkorrigierende Codes, bei denen naturgemäß mit 
Redundanz gearbeitet wird. 


Ein gängiges Verfahren einer fehlererkennenden Codierung ist dıe Verwendung eines 
Prüfbits. Sollen beispielsweise drei Bits (= acht Möglichkeiten) übertragen werden, so hängt 
man ein viertes Bit an, das z.B. so gewählt wird, dass die Quersumme immer gerade ist (even 
parity check). Zur 3-Bit-Folge 101 würde also das Prüfbit O treten: 1010 hat eine gerade 
Quersumme. Die 3-Bit-Folge 010 würde mit 1 ergänzt zu 0101 - wiederum einer Sequenz mit 
gerader Quersumme. 


Würde nun beı z. B. einer Datenübertragung die Sequenz 1110 auftreten, so wäre ım hier 
zugrundegelegten Szenario klar, dass ein Übertragungsfehler stattgefunden haben muss, denn 
dıe Quersumme ist nıcht geradzahlig. Hıermit kann nun keine Fehlerkorrektur stattfinden, 
aber der Empfänger der Daten kann prinzipiell den Sender auffordern, die (korrekte) Sequenz 
noch einmal zu schicken. 


Die für den PC-Bereich relevante Zeichen-Codierung geschieht mittels des ASC/I/, des 
American Standard Codes for Information Interchange. Hierbei handelt es sich um einen laut 
Standard sıeben Bit breiten Code, der dıe (US-amerikanischen) Zeichen beinhaltet. Darüber 
hınaus wird als erweiterter 8-Bit-ASCII der um jeweils nationale oder sonstige 
Sonderzeichen erweiterte Code verstanden. 


Unter Microsoft Windows kann der Code sehr schön ın dem Zusatzprogramm 
(Unicode-)Zeichentabelle betrachtet und eingesetzt werden. Im nachstehenden Bild wird der 
8-Bit-ASCII für Deutschland (in der Schriftart Times New Roman) dargestellt. Mit der Maus 
wurde das Zeichen mit der Code-Nummer 159, das Y, markiert. 


°" Dies muss nicht zwingend immer so sein. Kompressionsverfahren oder auch das bekannte Morse-Alphabet arbeiten 
gerade damit, dass häufig vorkommende Zeichen mit einer geringeren Bitbreite dargestellt werden als seltener 
auftretende. 
So ıst im Morse-Alphabet der häufig auftretende Buchstabe ‘e’ codiert mit . (einem Punkt), das sehr vıel seltener 
auftretende ‘x’ hat den Morse-Code - ... - (Strich Punkt Punkt Strich). 


- 36 - 


&® Unicode-Zeichentabelle 


Schriftart: IT Times New Roman r] weiter | Zeichenauswahl: | 
Gruppe: windowsZechn rl Zeichen Bi | | Auswählen fe Hilfe Schließen 


1 Wels le" Ich) = +, 1-1. 17[olı l2lsla [sts]? [als l: 1; [<i=[>1? 
@a [B Ic [DIE FIG HI IS IK IL IMINJoTP [or [Ss Ir uw pri frlzic hl) I 
lalble[dlelflginlilj IK lt mn lo [plgIr [st [ulvelz|ylzlclı ) IS 

oo rl beislcenlelolo"1-Fl- = Psblelol 
ilel& le #lı Is] @l®[el=]- Bf 1° [#12 [31° [ulgl- 1, [* 1°» aß Benz 
A 14 [A 14 ]A 1A Bele TE JE IE JE [TI TTTE BINIO [010 [018 x [alu lolu [ol [pie 
alslälälalselclelelelelilili li [a lälölölölälsl- (ala lulölüly[piy 
BR PP Pa PO PP RE 


IT äabelle der verfügbaren Zeichen im ausgewählten Zeichensatz. | Tasteln]; Alt+0159 


Zu beachten ist, dass der ASCII-Code nur auf 7 Bit standardisiert ıst. Das heißt: ein Text mit 
deutschen Umlauten auf einem PC kann bzw. wırd auf einem Apple Macintosh nur noch 
verstümmelt erscheinen: dıe Umlaute und °ßB’ werden als ırgendwelche anderen 
Sonderzeichen auf dem Macintosh wiedergegeben werden. Ähnlich verhält es sich mit Daten, 
dıe von einer UNIX-Anlage auf einen PC überspielt werden. Aber auch DOS und Windows 
benutzen zwei verschiedene ASCII-Varianten, die von Windows wird mit ANSI-Code 
bezeichnet. 


Die nachstehenden beiden Bildschirmabzüge zeigen einen kleinen Text, einmal ım 
MS-DOS-Editor (DOS-ASCH) und einmal, ohne dass eine Änderung an der Datei 
stattgefunden hätte, ın der Wındows-Textverarbeitung Lotus Word Pro (ANSI-Code). 


Bearbeiten Suchen Optionen 


EXT1.TXKT 
Dies ıst ein lext mıt Umlauten a. 0 und u 
sowie eınem B ım MS-DUS-Edıtor ._ 


F Lot SmartSuite 97 Word Pro - [texti.brt] x 
Ri Dstei Beabsien Anscht Entelen Test Ferster Hille „Islxl 
is BeRrelaleansee JE 
Haupttent \ Fi u 
u Dres ıst em Text mıt Umlauten „„” und UF 
sowie eırern 4 T 
Times Now Roman 7° 12° us FXK u DB Vvonzacuehart ] N 
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Neben dem ASCII-Code ıst noch der EBÜDIC (extended binary coded decimal information 
code) zu erwähnen, der ın der IBM-Großrechnerwelt verwendet wird. 


1.5.3. Codierung von Dateien 


Sehr vıel komplexer ıst die Codierung, wenn man sich nıcht um einzelne Zeichen oder 
Zahlen kümmert, sondern ganze Dateien, inbesondere Graphiken, behandeln möchte. Hier 
gibt es eine Vielzahl sogenannter Datei- und Graphikformate; einige werden, um einen 
gewissen Überblick herzustellen, im Anhang A.2. auf Seite 238 tabellarisch aufgelistet. 


Im wesentlichen entscheidet sich jeder Software-Hersteller zunächst einmal für ein eigenes, 
proprietäres Format. Um seine Kunden bei der Stange zu halten, wırd nıchts unternommen, 
was einen Wechsel zu einer anderen Software erleichtern würde. Wären die Dateiformate der 
einzelnen Programme offengelegt, so könnte beispielsweise jeder Anwender der Text- 
verarbeitungssoftware Microsoft Word auf StarWriter wechseln (oder umgekehrt) und könnte 
dabei seine alten Dateien unverändert öffnen und weiterbearbeiten. 


Sehen wir uns jeweils ein Dokument ın den beiden Textverarbeitungsprogrammen Microsoft 
Word für Windows (beispiel.doc) und Lotus Word Pro (beispiel.lwp) an. 


'W Microsoft Word - beispiel.doc f 


| Standard ” Arial ii ” FKU == u ’ 
Dun to 2 0031 ars Tragen 


Dies ist ein Beispieldokument in: Microsoft YYord-fürYindows .T 


[si Ai 1 [Beizdem zei Sp6i mar zn Erw ie| % 


Beide Dokumente enthalten (als bewußte Benutzereingabe) nur jeweils einen Satz, wıe auf 
den Bildschirmabzügen gezeigt. Doch schon dıe Dateigröße der beiden Dokumente differiert 


erheblich. 
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F Lotus Smart Suite Word Pro - [beispiel Ivupıf 
w2 Dat Geabeien Ansicht Erailen Gebe Tas Eyrar Earuir Häe PIr-IEN 


IL. SEITERF 


es ist ein Beispeeldokument ın Lotus Wvorg Pro 


” 


| # 
— HT — ET 


Während ın dieser konkreten Sıtuation dıe Word-Dateı 19 Kılobyte groß geworden ist, 
beansprucht die Lotus Word Pro-Dateı „nur” 10 Kilobyte. Gleichzeitig ıst allerdings auch zu 
bemerken, dass der eigentlich gespeicherte Text gerade mal um die 50 Bytes groß ıst! 


EN Explorer - C:\TMP 


Dateı Bearbeiten Ansicht Extras 2? 


‚Alle Ordner _ Inhalt von 'C:\TMP' 


Desktop 
=& a Arbeitsplatz 


nee 


= 3,9 Diskette (A) (8 beispiel.doc 139KB Microsoft Word-Dokument 
= 2, Diive-c (C.) | #2 beispiel.lwp 10KB Lotus word Pro 9 Dokument - 
| > 4 | > 
7 Obiektfe] 28,3 KB [Freier Speicher: 109 MB) vH 


Das heißt: ın beiden Fällen, Word wıe Word Pro, wurde über den eigentlichen Text hınaus 
eine ganze Menge weiterer Information gespeichert. Und das ıst auch nachvollziehbar, denn 
in einer Textverarbeitung werden u.a. auch Attribute wıe die Schriftart, die Schriftgröße, ggf. 
dıe Farbe des Textes, Eigenschaften der gesamten (Papier-)Seite usw. mitverwaltet und 
dementsprechend auch gespeichert. 
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Tr ra aa Y 1 1 To ar) 
DU DO 33 01 00 DO oa md  -....... Bel... 


BE DJ] ec O0 DO O0 DO I ROVER, .... 
Do oo EO O0 DO OO Do I Be ET 
Ddo oo 00 OD DO OO DO REN en ee 


Do oo DO O0 DO O0 DO Oo een renie a 
Do ob 00 00 DO O0 DO O0 re a EEE 
Do Do DO 00 DO O0 DO 00 AB TN 
Do ob DO O0 DO OO DO ea RR 
Do ob DO O0 DO O0 DO BEER TESTER Fee 
Do Do DO 00 DO Ob DO Do a TEREWERE 
ajı) OO 00 Oc 00 OC als O0 FIırIıIrTrI TIEF Tr ICH Fr GI 
Do 0b 00 O0 DO O0 DO O6 er N ERS 
20 65 69 SE 20 42 65 65 GHies Ist win Bei 
’5 80 65 BE ?4 20 69 GE spie Icukisent ırı 
66 74 20 57 Gr 72 Gd 20 Microsoft word 
Gr 7?’ ?’3 2E OD DO DO 0 1:7 wind, .... 

| Do ob 00 00 DO O0 DO U a 
DOOD 06509 O0 DO Dh DO O0 DO Ob DO 0 Dh dd oo DO O0 DO 0 er nenne 


Bild: Innenansicht einer Microsoft Word-Dateı” 


Sehen wır einmal spaßeshalber ın das „Innenleben” der beiden Dateien hinein: ım vorherigen 
Bild sehen wır „in dıe” Word-Dateı, der nachfolgende Schnappschuss zeigt eine Innenansicht 
der Dateı von Lotus Word Pro. In beiden Fällen sehen wir, dass eine ganze Menge uns (als 
„normalen Menschen”) unverständlicher Zeichen gespeichert ıst; bei dem Ausschnitt der 
Word-Dateı sehen wır offensichtlich auch die eigentliche Textpassage, bei dem Ausriss der 
Word Pro Dateı können wır offensichtlich nur erkennen, dass es sıch um eine WordPro-Dateı 
handelt, denn diese Information ıst zu Beginn der Datei ın Klarschrift gespeichert. 


2.’ GF | | 
DODO OD1D DQ 05 33 Sc BI 72 03 DD 40 CC C1 BF FF BD FS ?O eure spe € p 
DID00 ODZD 59 0S 04 11 9c A? Zu co 81 07 00 Ed 21 20 OD 23 0.4 i-.Di .# 
D0O0 0D3D Du 90 da 30 Sc 34 01 WO 05 DU 57 DE CB 21 03 DZ .CDOaäcc#. wIE!%a 
D0O0O OD#D 8A 9C 37 20 A3 HI Cl 43 0? 84 81 34 GC CA BC 20 eg? ;otl- ae]: u 


DODO mDSD 62 44 493 22 DO Ad DZ AU DD 20 90 dD DD 60 O1 BO DOM” :neäa. CM. ©C 
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Bereits seit langem arbeiten immer wieder Standardisierungskomitees daran, einheitliche und 
vor allem offengelegte Dateiformate zu definieren und zu verbreiten. Teilweise beteiligen 
sich auch namhafte Unternehmen dabeı. Erwähnt werden sollen hier drei offene Text- bzw. 
Dokumentformate. 


Rich Text Format 


Zum einen gibt es von der Fırma Microsoft das Rıch Text Format (RTF). Dieses wurde 
explizit für den offenen Datenaustausch mit Textverarbeitungssoftware anderer Hersteller, 
aber auch zum Datenaustausch zwischen verschiedenen Plattformen, erfunden. 


* Für Interessierte: Dieses und das folgende Bild zeigen den Inhalt einer Datei, wobei in den ersten beiden Spalten 
hexadezimal eine Speicheradresse angegeben ıst, danach folgen zeilenweise jeweils zweimal acht Byte, dargestellt durch 
den hexadezimalen Wert; ın der Spalte ganz rechts schließlich ıst zu sehen, was als ASCII-Zeichen von all dıesen 
Zeichen darstellbar ıst. Nicht darstellbare Zeichen sınd mit einem Punkt aufgeführt. 


- AD - 


Das heißt: wenn Sıe einen Text schreiben, der ım wesentlichen über dıe gängigen Atttribute 
wie „fett”, „kursiv”, „unterstrichen”, Schriftarten und -größen usw. verfügt, dann können Sie 
diesen auch im Format RTF speichern und z.B. per eMail an Menschen versenden, die 
eventuell dann doch mal kein Microsoft Word für Windows (oder nicht die passende 
Version) zur Verfügung haben sollten. 


Hypertext Markup Language 


Ein weiteres, von der Natur der Sache her offenes Format ist die Seitenbeschreibungssprache 
des World Wıde Web, HTML, die Hypertext Markup Language. Alle Internet-Browser 
„sprechen” diese Sprache, und wirft man einen Blick „hinein”, dann sieht man auch ohne 
HTML-Kenntnisse, dass dıes ein offenes Format ıst: man kann es mit relatıv wenig Aufwand 
lernen. (Siehe hierzu auch Abschnitt 8.5. auf Seite 236.) 


Heutzutage können fast alle modernen Textverarbeitungen Dokumente auch im 
HTML-Format lesen und speichern; insofern kann auch dieses Format in gewissen Grenzen 
als Austauschformat für (reine) Textdokumente dienen. 


Acrobat Reader 


Einen ganz anderen Weg hat die Firma Adobe” beschritten. Ausgehend von der lange 
währenden Problematik, dass es keinen anerkannten und offenen Standard für hochwertige 
DTP°-Dokumente gegeben hat, hat Adobe mit Acrobat einen neuen Quasi-Standard kreiert, 
der auch qualitativ sehr gut zur Speicherung von Dokumenten mit graphischen Elementen 
geeignet ist und den Ansprüchen des DTP genügt. Darüber hinaus hat Adobe durch einen für 
fast alle Betriebssysteme frei erhältlichen Browser, den sogenannten Acrobat Reader, dafür 
gesorgt, dass jedermann die (in der Regel mit der Dateiendung .pdf versehenen) 
Acrobat-Dokumente auch lesen (und ggf. ausdrucken) kann. 


Das Acrobat-Format wird u.a. von Hochschulen für wiıssenschaftliche Zwecke (Skripten, 
Arbeiten usw.) und teilweise auch ım Internet eingesetzt, daneben findet es sıch häufig auf 
CD-ROMs für sogenannte README-Dateıen und digitale Handbücher. 


Indirekte Direkte 
Datenausgabea Datenausgabe 
isuelle Akustische 
Datenausgabe Datenausgabe 
Bildschirm- Druck- COM- Sprach- Sprach- 
Anzeige Ausgabe Verfahren Wiedergabe synthese 


” Bekannteste Produkte von Adobe sınd sicherlich dıe Graphikprogramme PhotoShop oder Illustrator. 
»° DTP = Desktop Publishing 
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1.5.4. Codierung von Graphiken 


Eine spezielle und besonders vielseitige Form der Codierung stellt das Abspeichern von 
Graphiken (Zeichnungen, eingescannte Photos usw.) dar. Darum wollen wir uns an dieser 
Stelle etwas Raum nehmen, diesen Themenkomplex anzusprechen’. Zum Thema 
Graphikformate seı generell auf das Buch von [Born] verwiesen. 


Man unterscheidet verschiedene Formatfamilien anhand der Art und Weise, wıe die 
betreffende Graphik abgespeichert wird. 


1.5.4.1. Rasterformate (Pixelgraphiken, Bitmaps) 


Die sogenannten Rasterformate enthalten für jeden darzustellenden Punkt dıe Daten eines 
Bildes; jedem Bildpunkt oder Pixel sind seine Koordinaten und ein Farbwert’* zugeordnet. 
Die Vorteile dieser Methode: Bitmap-Graphiken sind sehr einfach zu erstellen, die Pixel 
können von entsprechender Software leicht einzeln oder gruppenweise manipuliert werden. 
Außerdem „passt” dieses Format auf alle punktweise operierenden Ausgabegeräte, z. B. 
Drucker oder Bildschirme. Nachteilig ıst anzumerken, dass Bitmapdateien sehr groß werden 
können, vor allem wenn sehr vıele Farben und/oder eine hohe Auflösung verwendet werden. 
Durch Kompressionsverfahren kann dem ın gewissem Maße jedoch entgegengewirkt werden. 


Ein gravierender Nachteil ıst allerdings, dass sıch Rasterformate nur schlecht skalıeren 
lassen; bei der Vergrößerung und der Verkleinerung besitzt das neu zu errechnende Bild 
durch Rundungsfehler ın der Regel eine erheblich schlechtere Qualität als das Original! 


1.5.4.2. Vektorformate 


Bei den Vektorformaten werden graphische Objekte durch eine formale Beschreibung 
abgespeichert. Eine (farbige) Linie zwischen zwei Punkten kann etwa dargestellt werden als 
Anweisung „Linie(Startpunkt,Endpunkt,Farbwert)”; ein parallel zum Koordinatensystem 
liegendes (ebenfalls farbiıges) Rechteck wäre beispielsweise notierbar ın der Form „Recht- 
eck(Linke-obere- Ecke,rechte-untere-Ecke,Farbwert)”. 


Diese Darstellungsform ıst leicht skalıerbar, dıe dargestellten Einheiten (Objekte) sınd relatıv 
leicht manipulierbar. Wird ein Kreis mit dem Durchmesser 10 cm ın einem Vektorformat 
gespeichert, so ıst auch ein Ausdruck mit dem Durchmesser 18 cm kein Problem, denn 
anhand der Abspeicherung „Kreis(Mittelpunkt,Durchmesser,Farbwert)” wird für den 
Ausdruck das so entstehende Bild neu berechnet. 


Vektorformate eignen sıch allerdings von Natur aus nicht für komplexe Bilder (wıe etwa 
Photographien), die pixelweise andere Farben besitzen’. 


Ww 
-— 


Einige weitergehende Informationen zum Stichwort „Graphikformate” finden sıch u.a. auf der WWW-Seite 
http://www .Irz-muenchen.de/services/software/grafik/grafikformate/. 


Ws 
[857 


Im Falle einer einfachen Schwarz-Weıß-Zeichnung besteht der Farbwert lediglich aus O für „schwarz” oder 1 für „weıß”, 
benötigt also nur 1 Bit. 


Ww 
Ww 


Neben Raster- und Vektorformaten sind auch sogenannte Metaformate gebräuchlich; hier werden sowohl Pixel- als auch 
Vektorinformationen abgespeichert. Die gängigsten Formate sind CGM (Computer Graphics Metafıle), PICT (Macintosh 
Picture) und WMF (Windows Metafile). 


-4) - 


1.5.4.3. Einige gebräuchliche Graphikformate 


Nachstehend seien ein paar gebräuchliche Graphikformate‘* aufgeführt. Unter Extension sind 
dıe Dateinamenendungen aufgeführt, die üblicherweise unter DOS und Windows verwendet 
werden. Der Aspekt der Datenkompression wird hier bereits erwähnt, aber erst im folgenden 
Kapitel 1.6. ausführlicher behandelt. 


Format Extension Farben, Bildgröße, Kompression usw. Raster 
Vektor 


Windows-Bitmap Farbtiefe: 1-Bıt (schwarz-weiß), 4-Bıt (16 Farben), 
8-Bit (256) oder 24-Bit (16,7 Mio.); meist keine 
Kompression (oder RLE); maximale Bildgröße 
65536 x 65536 Pixel 

CompuServe | Farbtiefe: 1 bıs 8 Bıt (maxımal 256 Farben); 

Graphics Interchange —. a 
maxımale Bildgröße X ixel; 

u 2 Besonderheit: dıe modernere „89a”-Version des 
GIF-Formates kann auch transparente Graphiken 
verwalten sowie „anımiıerte GIFs”, also Dateıen, ın 
denen mehrere Bilder gespeichert sınd, dıe von 
geeigneter Software als kleine „Diashow” 
abgespielt werden. 
GIF ıst eines der ım Internet (WWW) 
gebräuchlichen Formate. 


JPEG File | Farbtiefe bıs 24-Bıt; Kompression: JPEG; maxımale 
Interchange Format Bildgröße 65536 x 65536 Pixel; R 


(JFIF) JPEG ıst eines der ım Internet (WWW) 
gebräuchlichen Formate. 
Kodak Photo CD Farbtiefe bis 24-Bit; kodak-eigenes 
Kompressionsverfahren; 
maxımale Bildgröße 3072 x 2048 Pıxel; 
verwendet für Photo-CD-ROMs 
Tag Image File | Farbtiefe: 1- bis 24-Bit; 
Format (TIFF) Kompression: keine, RLE, LZW, CCITT sowie 
JPEG 
maxımale Bildgröße: ca. 4 Milliarden Bildzeilen; 
Besonderes: mehrere Bilder ın einer einzigen Dateı 
möglich! 
Dieses Format wırd häufig von Scanner-Software 
zur Abspeicherung von Photos verwendet. 
Postscript (PS), PostScript ist eine Seitenbeschreibungssprache von 
Encapsulated der Fırma Adobe; speziell geeignet für dıe Ausgabe V 
Postscript (EPS) auf dafür zugeschnittene Drucker (Post- 
Script-Drucker) 
V 


Corel Draw cdr Eigenes (proprietäres) Graphikformat der Fırma 
Corel Corp. für ıhr Programm ‚‚Corel Draw” 


Ein Format zur Speicherung und Übertragung von Bildinformationen muss in erster Linie 
möglichst kompakt sein. Im World Wide Web’ wurden und werden hierzu die Formate GIF 


»* Eine recht lange Liste von Graphikformaten finden Sie im World Wide Web beispielsweise auf der Seite 
http://web.urz.uni-heidelberg.de/doc/Unterstuetzung/Hinweise/Eıinzel/Grafik/Formate/index.html. 
> Vgl. hierzu auch Abschnitt 8.4.2. (S. 236). 
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und JPEG eingesetzt. Während JPEG vor allem zur Abspeicherung von Photos geeignet ıst, 
sind GIF-Dateien gut beı kleineren Zeichnungen mit wenigen Farben einsetzbar. 


Seit 1995 wırd mit dem „Portable Network Graphics” Format (PNG) der Versuch 
unternommen, Vorteile von GIF und JPEG unter einen Hut zu bringen und gleichzeitig die 
mit dem GIF-Format verbundenen Copyright-Probleme zu bewältigen”. PNG ist ein urheber- 
rechtlich freies Format, das neben dem 256farbigen Palettenmodell verschiedene Graustufen- 
und Echtfarbformate mit 5 bıs 16 Bit Auflösung pro Farbkomponente beherrscht. Auch eine 
optionale Transparenzkomponente (Alpha-Kanal) ıst vorgesehen. Die Möglıchkeiten des 
GIF-Formates, mehrere Bilder oder Anımations-Sequenzen speichern zu können, sind ın der 
Version 1.0 von PNG allerdings noch nıcht realisiert worden. 


Sehen wır uns abschließend ein paar Graphikdateien ın 
den Formaten GIF und JPEG einmal praktisch an. Ei Hallo. gil [4 17 


Zunächst soll es um eine einfache, nebenstehend 
abgebildete Strichzeichnung gehen: das farbige 

Original nutzt eine 4-Bit-Farbpalette, also einen H | 
Grundvorrat von 16 Farben. Diese Graphik wird nun | | | O0 ei 
gespeichert ın den Formaten GIF, JPEG, PCX und 


PNG. Dabei treten die folgenden Dateigrößen dieser ZZ 


70x 52 Pıxel großen Zeichnung auf. 


 ——— 


Bytes Dateiname 
357 HALIO.GIF 
1.736 HALIO.JPG 
1.493 HALIO.PCX 
319 HALLO.PNG 


Man sieht, dass hier das moderne PNG-Format am speicherplatzsparendsten ist, dagegen 
kann das JPEG-Format seine Vorzüge ın diesem Fall überhaupt nicht ausspielen. 


Wird diese Grafik nur als Schwarz-Weiß-Bild gespeichert, ergibt sich folgende Sıtuatıon. 


Bytes Dateiname 
249 HALIO-SW.GIF 

1.325 HALIO-SW.JPG 
404 HALIO-SW.PCX 
187 HALLO-SW.PNG 


Spielt man dieses Szenario dagegen mit einem eingescannten Photo durch, so sıeht die Sache 
erwartungsgemäß grundlegend anders aus. Ein eingescanntes Bild wurde ın den jeweiligen 
Formaten abgespeichert, bei JPEG lag dıe eingestellte Kompressionsrate bei 50%. 
Bytes Dateiname 
688.877 PHOTO.GIF 
108.194 PHOTO.JPG 
649.307 PHOTO.PCX 


478.183 PHOTO.PNG 
596.046 PHOTO.TIF 


Deutlich ıst zu sehen, welchen Vorteil das JPEG-Format bei Photos ausspielen kann; 
allerdings sei noch einmal betont, dass die Dateı PHOTO.JPG verlustbehaftet gespeichert ist, 
d.h. ın ıhr stecken auch nıcht mehr dieselben Informationen wıe beispielsweise ın der 
TIFF-Dateı. 


» Zum Thema PNG seı auf den Artikel „Bits ım Bilde ın der Zeıtschnft ‚ıX” verwiesen, der unter der Adresse 
http://www.heise.de/ix/artikel/9609116/ ım WWW nachgelesen werden kann. 
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Interessant vielleicht noch zu erwähnen, dass es bei JPEG ım Rahmen der wählbaren 
Kompressionsstufen zu weiteren erheblichen Platzeinsparungen kommen kann - allerdings 
zulasten der Qualität des Bildes. Neben der mit 50% Kompression gespeicherten Datei 
PHOTO.JPG werden nachstehend noch JPEG-Dateien mit 60, 70, 80, 90 und (natürlich nur 
zu Demonstrationszwecken auch mıt) 99% Kompression aufgeführt. 
Bytes Dateiname 

108.194 PHOTO.JPG 

92.715 PHOTO60.JPG 

76.742 PHOTO7O.JPG 

58.580 PHOTO80.JPG 


36.415 PHOTO90.JPG 
13.008 PHOTO99.JPG 


Welchen Kompressionsgrad man dabei noch akzeptabel findet, hängt von einem selbst ab. 
Klar ist natürlich, dass bei 99% Kompression von dem ursprünglichen Bild nicht mehr sehr 
viel übrıgbleibt, wıe dıe nachstehenden beiden Schnappschüsse illustrieren sollen, dıe die 
50%- und dıe 99%-Varıante untereinander zeigen. 


= Photo.ıpg [4:1] 


Fr] Photo99.jpg (4:1) 


age 


g = 
ie‘ 
'— 


" 


2 
u 


Bild: Vergrößerte Ausschnitte aus zwei JPEG-Dateien 
oben: bei 50% Kompression, unten: bei 99% Kompression 
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1.6. Datenkompression 


In diesem Unterkapitel sollen einige wenige Grundlagen der modernen Datenkompression 
angesprochen werden. Für weitere Lektüre seı u.a. auf das Buch “Grundkurs Informatik” von 
Hartmut Ernst verwiesen’. 


1.6.1. Ausgangssituation und Begriffsklärung 


Unter Kompression versteht man den Vorgang, Daten (z.B. Bild-, Ton- oder Videodaten) so 
umzukodieren, dass sie weniger Speicherplatz als ın ıhrem ursprünglichen Format benötigen. 
Dies kann dazu dienen, dass weniger Platz auf einem Speichermedium erforderlich ıst oder 
eine Datenübertragung (z.B. über das Internet) schneller vonstatten geht. 


Anknüpfend an den Begriff der Redundanz (vgl. Def. 1.4.2.4.) können wir formulieren, dass 
das Ziel der Datenkompression (zunächst) die Reduktion der Redundanz auf (nahe) null ist. 


Wir haben ım vorherigen Abschnitt bereits eine Anwendung von Datenkompression gesehen: 
bei der Photo-Abspeicherung kommt es ın der Praxis nicht auf eine exakte und damit viel 
Speicherplatz beanspruchende Darstellung an, es genügt vielmehr, wenn das menschliche 
Auge das betreffende Bild ohne störende Treppen- oder sonstige Effekte gut erkennen kann. 


Damit haben wir ein erstes Merkmal von Kompressionsmethoden kennengelernt: es gıbt 
“exakte” Verfahren, bei denen also - wıe bei der Codierung - die ursprüngliche Information 
in vollem Umfang aus der komprimierten Version wiıederhergestellt werden kann. Zum 
zweiten gibt es “approximative” Verfahren, bei denen - wıe bei der oben skızzıerten 
Photo-Darstellung - die ursprüngliche (technische) Information nicht vollständig wıeder 
rekonstruiert werden kann. Hier trıtt also ein Verlust an Information auf, der aber für eine 
bestimmte Art der Anwendung in Kauf genommen wird. Daher spricht man hier von 
verlustbehafteten Kompressionsverfahren ım Gegensatz zu den zuerst erwähnten, die 
entsprechend ver/ustfrei genannt werden. 


1.6.2. Verlustfreie Kompressionsverfahren 


Will oder muss man die vollständige Ausgangsınformation aus einem komprimierten Daten- 
bestand wıedererhalten, dann ist es zwingend, ein verlustfreies Verfahren einzusetzen. Beı 
der Mehrzahl der ınformationstechnischen Datenmengen ıst dies nötig - seı es bei Binärcode 
von ausführbaren Programmen oder Daten einer Datenbank: stets muss man bıs auf das letzte 
Bit dıe komplette Informatıon zur Verfügung haben. 


Bereits ın 1.4.2.7. (S. 27) haben wır mıt dem Huffman-Algorıthmus eine Codierung kennen- 
gelernt, dıe zu einer geringen Redundanz führt. Der daraus resultierende Code heıßt 
Huffman-Code. 


Aber es geht - zunächst - auch sehr viel einfacher. 


» Vel. [Emst], S. 90ff. 
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1.6.2.1. Run Length Encoding 


Einer der einfachsten Ansätze einer verlustfreien Kompression ıst die andere Darstellung von 
Wiederholungsstrecken. 


So kann eine Sequenz von 25 X-Buchstaben AXXXXXXKKXXKKKXKKKKKKKKKKKKX natürlich 
viel einfacher durch die verkürzte Form 25X dargestellt werden‘°. Diesen Ansatz nennt man 
Lauflängen-Codierung oder Run Length Encoding (RLE),. 


Diese Herangehensweise funktioniert natürlich auch höherdimensional. Eine (in logischer 
Hinsicht) zweidimensional aufgebaute Pixelgrafik kann entsprechend codiert (komprimiert) 
werden. 


Beispiel: RLE einer Pixelgrafik 


In der nachstehenden Skizze sehen Sıe den Buchstaben “H” gedanklich als 10 x 5-Pixel- 
grafik. 


EHE EEE EEE 


IN 


= I 
u - 
8 


HE BE BEE 


Werden schraffierte Felder mit 1, weiße Felder mit O codiert, so ıst dıe Grafik darstellbar ın 
der Form’” “0010010000 0010010000 0011110000 0010010000 0010010000”. Hierfür sind 
also offenbar 50 Bits notwendig. 


Mit einer einfachen Lauflängen-Codierung kann dies etwas verkürzt werden, wobei zunächst 
festgelegt werden muss, ab welcher Wiederholungslänge eine numerische Umcodierung 
stattfinden soll, denn auch die Darstellung der Zahlen erfordert Speicherplatz. 


Exemplarisch nehmen wir für unsere kleine Grafik den Schwellenwert 4. Dann kann (sehr 
einfach dargestellt) komprimiert werden: 


“001001<6:0>1001<6:0><4: 1><6:0>1001<6:0>1001<4:0>”. 


In diesem Beispiel werden also 18 Bits wie zuvor dargestellt, sechsmal tauchen Bitgruppen 
mit den Vorfaktoren 4 und 6 auf. Abstrahieren wır (aufgrund der hier sehr kleinen 
Datenmenge) davon, dass auf der Bit-Ebene wieder verwaltungstechnisch geklärt sein muss, 
wann eine Bit-Sequenz einen numerischen Vorfaktor darstellt und wann die orıginären 
Datenbits, dann haben wir folgende Zwischenbilanz: 18 Bits wıe zuvor plus 6 Bits für jede 
der Wıiederholungsgruppen zuzüglich sechsmal der Informatıon für einen Vorfaktor. 


Das heıßt: eine Einsparung in der Datenmenge gegenüber der vorherigen Darstellung haben 
wir, wenn1l8+6+6-x<50 bzw. x<4 gilt; hierbei ıst x der Speicherplatz, den ein Vorfaktor 


»® Um präzise zu sein: dies funktioniert wie hier gezeigt natürlich nur dann, wenn die Zifferzeichen (hier ‘2’ und ‘5°) 
“Meta-Informationen” sınd - also selbst nıcht zur Ausgangsdatenmenge dazugehören. Andernfalls wäre dıe Abspeiche- 
rung der Information “fünfundzwanzıgmal ‘X°” komplizierter zu codieren. 

” Die Leerzeichen wurden hier nur der besseren Lesbarkeit wegen eingefügt. 
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benötigt. Selbstverständlich macht sich ın der Praxis dieser Effekt erst bei größeren 
Bitmengen positiv bemerkbar. 


Der aufmerksame Beobachter hat aber aufgrund des speziellen Bildaufbaus inzwischen sicher 
eine weitere Idee für eine Kompression bekommen. Anstatt bitweise die Wiıederholungs- 
sequenzen durchzuzählen kann auch die zweidimensionale Gestalt der Grafik genutzt 
werden. In der Sequenz “0010010000 0010010000 0011110000 0010010000 0010010000” 
taucht die erste Zeile (= der erste 10-Bit-Block) vıermal auf. Also kann eine Kompression 
sich auch eine solche Tatsache nutzbar machen, eine Darstellung könnte also lauten: 
“0010010000 <1> 0011110000 <1> <1>”; dabei bedeutet “<1>” natürlich, dass es sıch um 
eine Kopie der ersten Zeile, des ersten 10-Bit-Blocks handelt. Im Spezialfall wäre das 
Datenvolumen auf 20+3x Bits geschrumpft, wobei x den Speicherplatz für einen Verweis auf 
einen 10-Bit-Block bzw. eine Zeile bezeichnet. 


Unter dem Stichwort “Quad-Trees” wırd eın weiterer Ansatz verstanden, bei dem eın 
zweidimensionales (rechteckiges) Muster sukzessive ın (z.B. jeweils vıer) Teilrechtecke 
zerlegt wird solange, bis ein solches Teilmuster nur noch aus gleichen Bits besteht. (Vgl. 
[Ernst], S. 91f.) 


1.6.2.2. Differenz-Codierung 


Für numerische Daten, beispielsweise Messreihen, eignet sich mitunter dıe sogenannte 
Differenz-Codierung. An Stelle der jeweils “autonomen” kompletten Daten werden nur die 
Differenzen abgespeichert. 


So kann die kleine Sequenz (hier dezimal und mit dem Trennzeichen Komma wieder- 
gegeben) “12837 12839 12766 12822 12825” gemäß einer solchen “Delta-Konvention” auch 
durch “12837 2 -73 56 3” verlustfrei codiert werden“. 


Verfeinern lässt sıch ein solcher Ansatz dadurch, dass bei zu großen Differenzen wıeder der 
vollständige Zahlenwert abgespeichert wird, was umgekehrt jedoch wieder zusätzliche 
Verwaltungsinformationen voraussetzt. 


1.6.2.3. Arithmetische Codierung 


Ein weiteres verlustfreies Verfahren ıst die sogenannte Arithmetische Codierung, die die 
Häufigkeitsverteilung von Eınzelzeichen verwendet. Interessant hierbei der Ansatz: ein 
kompletter Text wırd auf eine einzelne Gleitkommazahl aus dem Intervall [O,1[ abgebildet. 


Das Verfahren beginnt damit, dass das Intervall [O,1[ entsprechend der r Zeichen auch ın n 
Teilbereiche aufgeteilt wırd, deren Breite gerade der relativen Häufigkeit oder Auftritts- 
wahrscheinlichkeit der jeweiligen Zeichen entspricht. 


* Im wissenschaftlichen Bereich wird Ähnliches oft durch eine sog. Datenvorverarbeitung erreicht. In unserem Beispiel 
hieße das, dass die fraglichen Messdaten zum Beispiel um -12800 oder einen ähnlichen Wert verschoben werden 
könnten, damit die Werte selbst vergleichsweise klein bleiben. 
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Bevor wir ein konkretes Beispiel vorstellen, kurz der allgemeine Ablauf des Algorıthmus: 


Kompressionsalgorithmus: 
Ermittle die Intervalle J(z) der einzelnen Zeichen. 
Setze unten:=0 und oben:=1 als Startwerte. 
Über alle Eingabezeichen z: 
laenge := oben - unten 
oben := unten + laenge * obere _grenze(Z) 
unten := unten + laenge * untere_grenze(Z) 
Ergebnis: der aktuelle Wert ın der Variablen unten. 


Die Funktionen obere _grenze() und untere _grenze() geben die jeweiligen Grenzen der 
Intervalle J(z) des betreffenden Zeichens an. 


Die so erhaltenen Ergebnisse sind annähernd gleichverteilt, da jedes Zeichen entsprechend 
seiner relativen Häufigkeit berücksichtigt wird. 


Spielen wır es praktisch durch: zu codieren seı der Text bzw. die Zeichen-Sequenz “ESSEN”. 
Die relativen Häufigkeiten der drei hier vorkommenden Zeichen sınd damit h(‘E’)=0.4, 
h(‘S’)=0.4 und h(‘N’)=0.2; daraus ergeben sich die drei Intervalle 


JCE)=[0,0.4[, JS’) = [0.4,0.8[, JÜN)=[0.8,1.0[. 
Die o.e. Funktionen liefern also z.B. obere_grenze(‘S’) = 0.8 oder untere _grenze(‘S’) = 0.4. 


Komprimieren wir das Wort “ESSEN” nun mit dem o.g. Verfahren, dann ergibt sich 
folgendes Ablaufprotokoll. 


Zeichen z unten oben laenge 
Inıtialisıerung Ö l 
°E’ 0 0.4 | 
S 0.16 0.32 0.4 
"S’ 0.224 0.288 0.16 
°E’ 0.224 0.2496 0.064 
‘N’ 0.24448 0.2496 0.0256 


Das Ergebnis ist die letzte Belegung der Variablen unten, hier also 0.24448. Das heißt: der 
Text “ESSEN” wird codiert durch die Gleitkommazahl 0.24448. 
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Die umgekehrte Operation, die Dekompression, funktioniert wie erwartet: 


Dekompressionsalgorithmus: 

x := der Code für den fraglichen Text 

Solange x >0 
Suche und Ausgabe des Zeichens z mıtxe J(z) 
laenge := obere_grenze(Z) - untere _grenze(Z) 
x = (x - untere_grenze(z) ) / laenge 


Im konkreten Zahlenbeispiel ıst x = 0.24448. Das Zeichen z mit x e J(z) ıst z = ‘E’. Sodann 
wird die neue laenge berechnet: laenge := 0.4 - 0 = 0.4; anschließend wird x neu gesetzt: 
x = (x - untere _grenze(‘E’) ) / laenge = (0.24448 - O)/0.4 = 0.6112. 


Dieser Wert ıst positiv, also geht es weiter: Das Zeichen z mit xe J(z) ıst nun z = ‘S’. 
Anschließend: laenge := obere_grenze(‘S’) - untere _grenze(‘S’) = 0.4. 
x = (x - untere _grenze(‘S’) ) / laenge = (0.6112 - 0.4)/0.4 = 0.528. 


Auch dieser Wert ıst (erwartungsgemäß) positiv, es geht also weiter: Das Zeichen z mit 
xeJ(z) ıst wiederum z = °S’ Anschließend: laenge := obere _grenze(‘S’) - 
untere _grenze(‘S’) = 0.4. Und: x := (x - untere_grenze(‘S’) ) / laenge = (0.528 - 0.4)/0.4 = 
0.32. 


D) 


Immer noch ıstx > 0: Das Zeichen zmitxe J(z) ıtz=|E’. 
laenge := obere_grenze(‘E’) - untere _grenze(‘E’) = 0.4. 
x = (x - untere _grenze(‘E’) ) / laenge = (0.32 - 0)/0.4 = 0.8. 


Auf diese Weise wird jetzt das Zeichen z = ‘N’ gefunden und ausgegeben. laenge ıst danach 
0.2, x - untere_grenze(‘N’) = 0.8 - 0.8 = 0. Damit ist der Dekompressionsdurchgang beendet. 


Wie man leıcht sıeht, ıst die Arıthmetik ın diesem Verfahren ım Kern auf das Arbeiten mit 
den vıer Grundrechenarten beschränkt. Daher ıst für eine exakte Behandlung das Rechnen ın 
der Menge der rationalen Zahlen gut geeignet. Wır können daher dıe oben protokollierte 
Codierung des Textes “ESSEN” noch einmal mit Brüchen anstelle von reellen Zahlen 
dokumentieren. 


Zeichen z unten oben laenge 
Inıtialisıerung Ö l 
‘E’ 0 215 | 
"S’ 4/25 8/25 BRNS 
4 28/125 36 / 125 4/25 
EB 28/125 156 / 625 8/1253 
= 140 / 625 = 28/125 + 
8/125*2/5 
"N 924 / 3125= 156 / 625 16 / 625 
140/625 + = 28/125 + 
56/625 * 4/5 16/625*] 
= 780 / 3125 


Beı der DV-technischen Realisierung kann nun noch dahingehend optimiert werden, dass nur 
dıe Potenzen (hier der 5) für den Nenner abgespeichert werden; insbesondere ıst die 
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Darstellung als Bruch stets präzise, während die obige Gleitkommadarstellung rechnerische 
Ungenauigkeiten mit sıch bringt. 


1.6.2.4. LZW - Lempel-Ziv-Welch-Algorithmus 


Ein sehr effizienter und in der Praxis oft eingesetzter Algorıthmus ist das von Lempel und 
Zıv erfundene und von Welch verbesserte statistische Verfahren, das nıcht auf der Basıs von 
Einzelzeichen, sondern unter Berücksichtigung von Wiederholungssequenzen komprimiert. 


Der LZW-Algorithmus ist umso effektiver, desto mehr Wiederholungsstücke vorhanden sınd 
- und desto länger diese sind! Das Ergebnis der LZW-Komprimierung ist eine fast 
redundanzfreie Sequenz, die verlustfrei ı1.a. nicht mehr weiter komprimiert werden kann. 


Das Verfahren arbeitet mit einer Code-Tabelle. In diese werden zu Beginn alle Einzelzeichen 
des zugrundeliegenden Alphabets mit ıhrer entsprechenden Bitsequenz (-dem Code-) 
eingetragen. Während der Verarbeitung der zu komprimierenden Eingabe wird diese 
Code-Tabelle um längere Zeichenketten ergänzt; sobald sıch diese dann wıederholen, beginnt 
der posıtive Effekt der Kompression. 


Die Codierung eines Strings S ıst nachstehend formuliert. 


l. Die Code-Tabelle wird mit allen Einzelzeichen des Alphabets initialisiert. 


cc» 


2. Der Präfix-String P wird auf den leeren String gesetzt, P := 


3. Für jedes Zeichen z aus der Eingabe S : 
ist Pz ın der Code-Tabelle, 
dann P :=Pz 
andernfalls 
Eintragen von Pz ın die Code-Tabelle 
Ausgabe des Codes für P 
I 


4. Ausgabe des Codes für P 


Auch dieses Verfahren wollen wir kurz an einem konkreten Beispiel illustrieren®'. Wir 
komprimieren den String S := “ABABCBABAB”. Als Länge der Code-Tabelle wählen wir 
(etwas willkürlich) 8, so dass wir mıt einem 3-Bit-Code auskommen. 


Die Inıtialisierung der Code-Tabelle sıeht also wıe folgt aus. 


* Das numerische Beispiel ist aus [Ernst], S. 103f entnommen. 
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Präfix Code 


A 000 
B 001 
C 010 
O1l 
100 
101 
110 


111 


Nun wird der String S codiert. Das Präfix P wird auf den leeren String “” gesetzt. Gelesen 
wird z:= A’. 


akt. Position Präfix P Eintrag ın die Ausgabe 
Code-Tabelle 

ABABCBABAB (init.) 
ABABCBABAB A 
ABABCBABAB B AB=011 000 (Code für A) 
ABABCBABAB A BA = 100 001 (Code für B) 
ABABCBABAB AB 
ABABCBABAB C ABC = 10] Oll(=AB) 
ABABCBABAB B CB = 110 010 (=C) 
ABABCBABAB BA 
ABABCBABAB B BAB=111 100 (= BA) 
ABABCBABAB BA 
ABABCBABAB BAB 
ABABCBABAB 111 (= BAB) 


Anschließend sıeht die Code-Tabelle wıe folgt aus. 


Präfix Code 
A 000 
B 001 
C 010 
AB oll 
BA 100 
ABC 101 
CB 110 
BAB 111 


Die generierte Ausgabe lautet somit 000 001 O11 010 100 111 (oder dezimal notiert zur 
besseren Lesbarkeit) 013247. 
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Die LZW-Dekomprimierung funktioniert entsprechend “rückwärts”: 
l. Die Code-Tabelle wird mit den Einzelzeichen initialisiert (wie zuvor). 
2: 2 


3. Für jedes Eingabezeichen (bzw. jede Eingabebitgruppe) c : 
Ist c ın der Code-Tabelle enthalten? 
Falls ja: 
Ausgabe des Strings zum Code c 
z := 1.Zeichen dieses Strings 
Eintragen von Pz in die Code-Tabelle (falls noch nıcht vorhanden) 
P := String zum Code c 
Falls nicht: 
z := 1.Zeichen von P 
Ausgabe Pz 
Eintragen von Pz ın die Code-Tabelle 
P=Pz 


Auch beı diesem Algorıthmus bieten sıch eine Reihe von Optimierungen ın der praktischen 
Umsetzung an; beispielsweise wırd eine Code-Tabelle ın der Praxıs deutlich mehr als acht 
Einträge aufweisen, so dass sıch für das Suchen und Auffinden von Einträgen eine 
Hash-Codierung anbıetet. 


1.6.3. Verlustbehaftete Datenkompression 


Beı verlustbehafteten Kompressionsverfahren geht ein Teil der Orıginalinformatıon (z.B. der 
Grafik) verloren. Hat etwa eine Anzahl von Pixeln nur minimal verschiedene Farbwerte, so 
kann hier „gerundet” eın einziger Farbwert verwendet werden. Diese Pıxel bilden dann eine 
gleichfarbige Gruppe. Im Idealfall ıst der Unterschied zum Original für das menschliche 
Auge nicht sıchtbar. Im Vergleich zu nıcht-verlustbehafteten Verfahren sind mit verlust- 
behafteter Kompression naturgemäß wesentlich höhere Kompressionsraten erreichbar. 


Auch hier zunächst ein einfaches Beispiel einer verlustbehafteten Komprimierung. 


1.6.3.1. Verlustbehaftete Differenz-Codierung 


Die ım vorigen Abschnitt besprochene Differenz-Codierung ıst naheliegenderweise auch 
verlustbehaftet möglich. Die Sequenz “12837 12839 12766 12822 12825” kann, wenn es nur 
auf Größenordnungen modulo 10 ankommt, als “12840 0 -70 60 0” gespeichert werden. 
Selbstverständlich muss hier über lange Strecken mit kumulierten Rundungsfehlern 
gerechnet werden, so dass sıch “von Zeit zu Zeit” eine Nachjustierung anbietet, d.h. ın 
gewissen Abständen sollte hier wieder ein Originalwert anstelle einer Differenz gespeichert 
werden. 
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1.6.3.2. JPEG und MPEG 


Der bekannteste verlustbehaftete Kompressionsalgorithmus ıst JPEG (Joint Photographic 
Experts Group). Hierzu gehört das gleichnamige Dateiformat, das ın der Windows- und 
DOS-Welt üblicherweise mit der Extension .jpg einhergeht. Auch das Video-Format MPEG 
(benannt nach der Moving Pictures Expert Group) ıst ein Beispiel für ein verlustbehaftetes 
Kompressionsverfahren. 


Der JPEG-Standard umfasst eine Reihe von grundlegenden Kompressionsmethoden, wobei 
sich für die Bildcodierung das auf der sog. diskreten Kosinustransformation (discrete cosine 
transformation, DCT) beruhende Verfahren durchgesetzt hat””. 


Aus Zeitgründen wird auf die mathematische Behandlung der Fourier-Transformation u.a. an 
dieser Stelle verzichtet. Stattdessen seı stellvertretend auf dıe recht umfassende Ausführung 
von B. L. Winkler (sh. [Winkler] ım Literaturverzeichnis) verwiesen, die ım FHDW Intranet 
auf der Startseite zu “Grundlagen der Informatık” als PDF-Datei heruntergeladen werden 
kann. 


#2 Sıehe hierzu z.B. dıe Ausführungen von Joachim Schwarz und Guido Sörmann, [SchwSör] ım Literaturverzeichnis. 
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2. SOFTWARE 


Der Betrieb eines Computers setzt, vereinfacht gesagt, funktionierende Hardware und 
Software voraus. Salopp formuliert ıst Hardware das, was man prinzipiell anfassen kann 
(siehe Seiten 63 ff). Software ist** der Sammelbegriff für die System- und die Anwendungs- 
programme einer Datenverarbeitungsanlage. Ein Programm ist dabei eine endliche Folge von 
Befehlen, dıe der Computer, eventuell wiederholt, abzuarbeiten hat. 


Die gesamten, aufeinander abgestimmten Systemprogramme bilden gemeinsam das 
Betriebssystem des Rechners. Dieses steuert und überwacht den Ablauf von 
Anwendungsprogrammen. 


Man unterscheidet hierbei zwischen Single- und Multi-User-Systemen, je nachdem, wieviele 
(logische) Benutzer gleichzeitig mit dem System arbeiten können, und zwischen Single- und 
Multi-Processing-Systemen. Bei einem Multi-Processing-System kann nicht nur ein Prozess 
zu einer Zeit abgearbeitet werden, sondern es teilen sich ggf. viele Prozesse die zur 
Verfügung stehende Rechenzaeit. 


Zusätzlich gıbt es systemnahe Software, dıe das Funktionsspektrum des Betriebssystems 
selbst übertrifft, aber noch unterhalb der eigentlichen Anwenderschicht anzusiedeln ist. 
Hierzu gehören Datenbankmanagementsysteme (DBMS), Datenfernverarbeitungssoftware 
oder Programmentwicklungssysteme. 


Anwendungsprogramme bieten dagegen Lösungshilfen für fachliche Probleme. Dazu 
gehören technisch-wissenschaftliche, kommerzielle, auf betriebliche Funktionen bezogene 
Programme sowıe spezielle Branchensoftware. Auch die bekannten, eher universell 
einsetzbaren Textverarbeitungs- und Tabellenkalkulations- oder Graphikprogramme gehören 
ın diese Rubrik. 


2.1. Programmdelfinition 


Ein Algorithmus wird“ definiert als „endliche Folge eindeutiger Anweisungen zur Lösung 
eines Problems”. Unter einem Programm versteht man einen „Algorithmus ın einer der 
Maschine übermittelbaren Form”, also eine Verarbeitungsvorschrift bestehend aus einer 
endlichen Folge von einzelnen Instruktionen, die im Maschinencode des jeweiligen Rechners 
oder ın einer noch ın den entsprechenden Maschinencode zu übersetzenden Sprache 
vorliegen. Hierbei werden Daten manipuliert, dıe ın sogenannten Datenstrukturen 
(Datentypen) logisch aufgebaut und physisch im Speicher“ des Rechners gehalten werden. 


Nach Niklaus Wirth“ ergibt sich die klassische „Kurzdefinition””: 


Programm = Algorithmus + Daten(strukturen) 


® Zitiert nach [Hansen]. 

“ gemäß DIN 44 300 

*% Dabei ıst es zunächst unerheblich, ob es sıch hierbei um physischen Arbeitsspeicher oder eine andere Form von Speicher 
handelt. 

* Siehe [Wirth]. 

* Hier zitiert nach [Lehner], S. 313. 
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Ein solches Programm wird konkret formuliert ın einer Programmiersprache, laut DIN 
44 300 eın „Mittel zur eindeutigen Formulierung eines Algorıthmus”, beispielsweise C, Java, 
Pascal, COBOL. Auf die verschiedenen Programmiersprachen wird später (in Abschnitt 2.3.) 
genauer eingegangen. 


Ein ın einer solchen Sprache formulierter Code, z.B. ın Pascal, muss durch einen Compiler 
übersetzt werden ın vom Prozessor ınterpretierbaren Maschinencode. 

Gemäß DIN 44 300: Ein Compiler ist ein (Übersetzer-)Programm zur Umformung eines 
Programmiersprachen-Programms (Quellcode, source code) ın ein Maschinenprogramm 
(Binärcode, object code. 


Im Bereich der Software unterscheidet man häufig zwischen der sog. System- und der 
Anwendungssoftware. 


Software Sammelbesgriff für die >sSystemprogramme und die >sAnwen- 
dungsprogramme einer EDV-Anlage 

Systemprogramme Die gesamten, aufeinander abgestimmten Systemprogramme 
bilden das Betriebssystem eines Rechners. Es steuert und 
überwacht die Abwicklung von Anwendungsprogrammen. 


Insbesondere hat das Betriebssystem die sog. Betriebsmittel 
zu verwalten: Prozessoren, Prozesse (=laufende 
Programme), Arbeitsspeicher, Ein-/Ausgabemedien, Dateien 
u.a. Daten. 

Anwendungsprogramme Die Anwendungsprogramme bieten Lösungen für fachliche 
Problemstellungen, dazu gehören neben den Standard- 
programmsparten Textverarbeitung, Tabellenkalkulatıon, 
Datenbankapplikation, Terminkalender usw. auch tech- 
nısch-wissenschaftliche Programme (z.B. für mathematische 
oder statistische Berechnungen), kommerzielle / allgemein 
betriebliche Programme (etwa für die Finanzbuchhaltung) 
und spezielle Branchenprogramme. 


Systemsoftware Anwendungssoftware 
Datenbankt| Datenfern-!|| SW-Entw. Technisch-| | Kommerz. || Branchen- 
verwaltung| | verarbeitg. (Compiler etc.) wiss. SW Software || software 
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2.2. Software- und Programmentwicklung 


Unter Software versteht man die Gesamtheit aller Programme, die auf einem DV-System 
vorhanden sınd. Software unterliegt dem allgemeinen Lebenszyklus von Anwendungs- 
systemen, dem sogenannten Software-Lebenszyklus: die nachstehende Skizze zeigt das 
sogenannte Wasserfallmodell. 


Anftorderungsanalyse 
SU Tree Te eng nn u. Software-Design 


SR emTam er weg | Implementierung und Testen | Testen x 


N Integration und System-Test 


Betrieb und Wartung 


l. Anforderungsanalyse 
Welche Aufgaben sınd zu erfüllen? 


2. System- und Software-Design 
Entwurf des erforderlichen Gesamtsystems und der Software 


3. Implementierung und Testen 
Erstellen und Testen der Software 


4. Integration und Systemtest 
Einbinden der Software ın den betrieblichen Ablauf und Testen der Software ım 
Gesamtrahmen 


5. Betrieb und Wartung 
Produktiver Einsatz der Software mit parallel stattfindenden Wartungsarbeiten 


Die obige Skizze soll deutlich machen, dass es sich hierbei um keine Einbahnstraße ın der 
Software-Entwicklung handelt: vielmehr kann aus jeder Phase auch wieder eine 
Rückwirkung auf die Phase(n) davor erfolgen, dıe eine Modifikation des konkreten 
Programmocdes oder sogar des Designs der Software erforderlich machen kann. 


Neben dem hier gezeigten Wasserfallmodell gibt es natürlıch noch andere 
Veranschaulichungen des Grundproblems Software-Lebenszyklus; andere Modelle betonen, 
dass es sich nıcht um streng abgeschlossene Phasen (wıe hier beim Wasserfallmodell) 
handelt. 
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Zitiert nach [Stahlknecht] stellt sich die Systementwicklung in einem Unternehmen 
skizzenartig dar wıe folgt. 


Unter dem Stichwort Realisierung werden ın der Regel die Phasen Programmentwicklung 
(Programmierung, Codierung) und der Programm- und Systemtest zusammengefasst. 
Gelegentlich trennt man Programmentwicklung von Codierung: dann meint ersteres das 
„Denken”, das Entwickeln der Algorıthmen und deren Umsetzung ın die 
Programmiersprache, und das Codieren ıst das „Tippen”, das konkret ‚„mechanische” 
Erzeugen des Programmcodes. 


Zur Dokumentation und ggf. leichteren Lesbarkeit von Algorithmen wurden verschiedene 
Methoden entwickelt. Gab es früher einmal Programmablaufpläne (PAP), so sind es heute 
- neben der Dokumentation ın einem Pseudo-Code - ın der Regel Struktogramme (nach 
Nassı-Shneidermann), mıt denen Programmabläufe dargestellt werden. 


Wiederholungsbedingung Iteration (Wiederholung) 
mit vorheriger Prüfung 
("kopfgesteuerte Schleife") 


Anweisung(en) 


Iteration (Wiederholung) 
mit anschließender Prüfung 
Anweisung(en) ("fußgesteuerte Schleife") 


Wiederholungsbedingung 


Sequenz (Aufeinanderfolge) von Anweisungen 


Anweisungsblock 2 
Anweisungsblock 3 


Anweisungsblock 4 


Bedingung u Alternative (Verzweigung) 


Bild: Verschiedene Struktogramme nach Nassi-Shneidermann 
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Für den Pseudo-Code wird häufig die Programmiersprache Pascal verwendet (oder zumindest 
ein Pseudo-Code angelehnt an Pascal benutzt). Der Einfachheit halber wollen wir uns hier ein 
wenig Pascal” vornehmen. 


Beispiel 1: Die größere von zwei zunächst einzugebenden ganzen Zahlen soll auf den 
Bildschirm ausgegeben werden. Hierfür werden zwei Speicherplätze für ganze Zahlen 
(Englisch: integer) benötigt, dıe wir hier a und b nennen wollen. 


Der (Mini-)Algorıthmus für dieses Beispiel lautet dann: 
l. Eingeben von a und b von Tastatur 
2. Wenn a größer als b ıst (mathematisch: a> b), dann wird a ausgegeben, sonst b 


In einem Struktogramm sıeht dies so aus. 


Eingabe b 


m 


In unserem Pseudo-Code Pascal lässt sich dieses Beispiel wıe folgt formulieren. 


program beispiell; 
var a, b: integer; 
begin 
read(a); 
readib); 
if a> b then 
write(a) 
else 
write(b) 
end. 


Zunächst wırd hier gemäß) der Syntax von Pascal festgehalten, dass es sich um das Programm 
namens „beispiell” handelt. Dann wird notiert, welche Variablen (Speicherplätze) benötigt 
werden und von welchem Datentyp“ diese sind. Mit „begin” und „end” werden die 
Anweisungen des Pascal-Programms eingerahmt. 


Zunächst werden mit den read-Anweisungen die Variablen a und b von Tastatur eingelesen; 
anschließend wird durch die Bedingung ‚wenn a größer als b ıst” verzweigt, je nachdem, 
welche Werte ın a und b aktuell stehen. Ist beispielsweise a=1 und b=2, so trıfft die 


“ In der PC-Welt stammt der dominierende Pascal-Dialekt von der Firma Inprise (vormals Borland), die derzeit unter dem 
Produktnamen Delphi den Nachfolger des legendären Turbo Pascal vertreibt. 

” Der Datentyp legt fest, was in diesen Variablen gespeichert werden soll. integer steht für „ganze Zahlen”; gleichzeitig ist 
hiermit auch bestimmt, wıeviel Speicherplatz vom Compiler bereitgestellt werden soll. Beim Turbo Pascal Compiler von 
Borland erhält eine integer-Variable zwei Byte Speicher bereitgestellt. Eine solche Variable kann also, wıe man leicht 
nachrechnet, (zu verschiedenen Zeitpunkten) 65536 verschiedene Werte beinhalten. In der Regel ıst dies dann der 
Zahlenbereich von -32768 bis +32767. 
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Bedingung nicht zu - und das Programm geht zum else-Zweig, gibt hier also den Wert von b, 
die 2, auf den Bildschirm aus. 


2.3. Programmiersprachen in der Übersicht 


Man kann Programmiersprachen nach verschiedenen Gesichtspunkten kategorisieren. Eine 
Sichtweise ıst das Sprachniveau, d.h. ın welcher Nähe zum Prozessor ıst der Programmcode 
zu formulieren. 


Maschinenorientierte Maschinensprachen prozessorspezifisch, z.B. 80x86- oder 
Sprachen 8088-Maschinencode 
0001 1010 0011 0100 
„Addiere” 3 4 
Assembler IBM PC-Assembler 
ADD 3,4 
Problemorientierte, Allgemeine höhere BASIC (Beginners All Purpose 
höhere Sprachen (all purpose Symbolıc Instruction Code) 
Programmiersprachen languages) LETSUMME = 3 +4 
Pascal 
- prozedural a ee 
(Pascal, C) 
- objektorientiert a 
(CH, Java, Smalltalk)  S’mme = 344; 
COBOL 


MOVE 3 +4 TO SUMME 

aus dem Bereich der Künstlichen 
Intelligenz (KJ): 

ProLog (Programmieren ın Logik) 
LisP (Listenprogrammierung) 


Spezialısıerte höhere 
Sprachen 


SNOBOL (Zeichenkettenverarbeitung) 


Nachfolgend wird ein Überblick über die verschiedenen Generationen von 
Programmiersprachen gegeben. Er basıert auf einem Text der Universität Halle, der unter der 
Internet-Adresse http://www.informatik.uni-halle.de/lehre/c/c12.html abgerufen werden kann. 


Programmiersprache: Sprache zur Formulierung von Rechenvorschriften, d.h. von Daten- 
strukturen und Algorithmen, dıe von einem Computer ausgeführt werden können. Häufig 
werden heute 5 Generationen von Programmiersprachen unterschieden: 


l. Generation: Maschinensprachen 


Befehle werden direkt in einer Maschinensprache notiert, d.h. als Folge von Zahlencodes. Da 
sıch der Befehlssatz von Rechner mit unterschiedlichen Prozessoren ım allgemeinen 
unterscheidet, sind ın Maschinensprache geschriebene Programme nur sehr schwer 
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übertragbar. Die direkte Programmierung ın einer Maschinensprache wird heute kaum noch 
verwendet. 


Einige Programmiersysteme für höhere Programmiersprachen gestatten es, Maschinenbefehle 
in den Quelltext zu integrieren. Die Anwendung beschränkt sıch dann auf solche Fälle, ın 
denen es aus funktionalen oder Effektivitätsgründen unumgänglich oder nützlich ist, 
maschinennah zu programmieren. 


2. Generation: Assembler 


Anstelle von Zahlencodes wırd mit Hilfe von symbolischen Bezeichnern codiert. Eine 
Assembleranweisung wird ın genau einen Maschinenbefehl umgesetzt. Auch Assembler- 
programme sınd deshalb ım allgemeinen an einen bestimmten Prozessortyp gebunden. 
Makroassembler gestatten die Bildung von parametrisierbaren Befehlsgruppen. Eine Makro- 
anweisung wird ım allgemeinen ın mehr als einen Maschinenbefehl umgesetzt. 


Der Anteil der Assemblerprogrammierung ist ım Sınken. Der Möglichkeit der Erstellung 
effektiver Programme steht die erschwerte Wartbarkeit von Assemblerprogrammen 
gegenüber. Maschinennahe Programmierung - dıe Domäne von Assembler - kann heute 
überwiegend durch höhere Programmiersprachen abgedeckt werden. Hierfür kommt z.B. C ın 
Frage, auf dem PC zum Teil auch Turbo Pascal. 


Einige Programmiersysteme für höhere Programmiıersprachen gestatten es, Assemblerbefehle 
in den Quelltext zu integrieren. Die Anwendung kann sıch dann auf die Situationen 
beschränken, ın denen es aus funktionalen oder Effektivitätsgründen notwendig oder nützlich 
ist, maschinennah zu programmieren. 


3. Generation: höhere Programmiersprachen (high level language) 


Sprachen der 3. Generation unterstützen unmittelbar die Notation von Algorıthmen, sıe sind 
weitgehend anwendungsneutral und maschinenunabhängig. 

Erste höhere Programmiersprachen entstanden ab Mitte der fünfzıger Jahre (ForTran, 
COBOL, ALGOL-60). Weitere Sprachen dieser Generation sind zum Beispiel Pascal, 
Modula-2, PL1, C, ADA, BASIC, SIMULA. 


4. Generation: Fourth Generation Language (46L) 

Sprachen der 4. Generation sind anwendungsbezogen (applıkative Sprachen). Sıe stellen ı.a. 
dıe wıchtigsten Gestaltungsmittel von Sprachen der 3. Generation zur Verfügung, zusätzlich 
jedoch Sprachmittel zur Auslösung von relativ komplexen, anwendungsbezogenen 
Operationen, beispielsweise zum Zugriff auf Datenbanken und zur Gestaltung von 
Benutzeroberflächen. 


Sprachen der 4. Generation gehören häufig zum Umfeld von Datenbanksystemen. Eine 
relativ weıt verbreitete Sprache dieser Art ıst z.B. NATURAL von Adabas oder SOZL 
(structured query language, strukturierte Abfragesprache). 


5. Generation: (Very High Level Language, VHLL) 


Sprachen der 5.Generation gestatten das Beschreiben von Sachverhalten, von Problemen. Sıe 
kommen vor allem ım Bereich der KI (künstliche Intelligenz) zum Einsatz. Die Wahl des 
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Problemlösungsweges kann (entsprechend dem Sprachkonzept) dem jeweiligen System 
(weıtgehend) überlassen werden. 


Bekanntestes Beispiel für eine Sprache der 5. Generation ist ProLog (Programmieren in 
Logik). 


Sprachen der 1. Generation sind zwangsläufig hardwareabhängig. Auch Sprachen der 2. 
Generation sind stark hardwarebezogen. Sprachen beider Generationen werden daher auch 
als maschinenorientierte Sprachen bezeichnet. 


Mit den Sprachen der 3. bis 5. Generation wırd eine weitgehende Hardwareunabhängigkeit 
angestrebt. Die Darstellung der Problemlösung (3. Generation) bzw. des Problems selbst 
(4. und vor allem 5. Generation) rückt stärker ın den Mittelpunkt. Diese Sprachen lassen sıch 
auch als problemorientierte Sprachen kennzeichnen. 


Gegenwärtig spielen vor allem dıe nachstehend genannten Programmiıersprachen eine Rolle, 
dıe alle als prozedural oder objektorientiert einzustufen sınd (die Reihenfolge ıst alpha- 
betisch): 


°e Ada 
Ergebnis einer Ausschreibung des USA-Verteidigungsministeriums ın der zweiten Hälfte 
der siebziger Jahre 
gute Standardisierung (1979, 1983), neuer Standard Ada 95 
als universelle Programmiersprache konzipiert, sehr großer Sprachumfang 


°e BASIC ( Beginners All-purpose Symbolıc Instruction Code ) 
als Anfänger-Programmiersprache Mitte der sechziger Jahre konzipiert (T. Kurtz, J. 
Kemeny) 
BASIC-Systeme arbeiten häufig interpretativ 
neuere BASIC-Systeme (z.B. Visual BASIC) bieten häufig eine große Leistungsbreite 
(strukturierte Programmierung, Grafik, Datenbankzugriff), gewährleisten jedoch keine 
Portabilität 


. C 
wurde Anfang der siebziger Jahre ın den AT&T Bell Laboratories als 
Systemprogrammiersprache ım Zusammenhang mit dem Betriebssystem UNIX 
entwickelt (D. Ritchie) 
heute auf allen Rechner- und Systemplattformen verfügbar, gute Standardisierung 
wachsende Bedeutung ım Bereich der professionellen Software-Entwicklung 
großer Gestaltungsspielraum - ım positiven wıe ım negativen - für den Programmierer, 
deshalb wenig geeignet als Ausbildungssprache 


. CH 
Erweiterung von C um Ausdrucksmittel der objektorientierten Programmierung Anfang 
der achtzıger Jahre ın den AT&T Bell Laboratories (B. Stroustrup), Sprach- 
standardisierung ın der Endphase (1997 abgeschlossen) 


. CH 
Unter dem Namen “C#” - lies: c-sharp - hat Microsoft wıeder einmal einen Versuch 
unternommen, offene und anerkannte Standards um selbstgebastelte Varianten zu 
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erweitern. C# ıst im Kern ein aus Java und C++ zusammengerührte Programmiersprache, 
die im Kontext von “.NET” - lies dof-net - eingesetzt wird. 


COBOL ( Common Business Oriented Language ) 

war (und ist teilweise noch) weit verbreitet im Bereich der kommerziellen 
Datenverarbeitung, 

für technische Aufgabenstellungen wenig geeignet, 

entstand Ende der Fünfziger Jahre des vorigen Jahrtausends (CODASYL Commitee), 
Weiıterentwicklung über verschiedene Standards: COBOL 74, COBOL 85, Object 
COBOL. 


ForTran ( Formula Translator ) 

universelle Programmiersprache, vor allem geeignet für den wissenschaftlich-technischen 
Bereich, erste Version Mitte der Fünfziger Jahre entwickelt (J. Backus), 
Weiterentwicklung der Sprache über verschiedene Standards: FORTRAN 66, FORTRAN 
77, Fortran 90, Fortran 95. 


Java 

aus C++ von der Firma Sun entwickelte objektorientierte Programmıersprache 
ursprünglich insbesondere zur Programmierung von Chips ın Geräten (Waschmaschine, 
Kaffeeautomat usw.), dann Durchbruch in Zusammenhang mit der Programmierung im 
Internet und Intranet (Programme und Applets). 


Pascal 

universelle Programmiersprache; Ende der sechziger, Anfang der siebziger Jahre speziell 
für Ausbildungszwecke entwickelt (Niklaus Wirth, ETH Zürich), verbreitet vor allem für 
dıe Entwicklung von Individualsoftware auf PC, spielt im Bereich der professionellen 
Software-Entwicklung nur eine geringe Rolle. 

Programmierung ‚im Großen” wırd durch den ursprünglichen PASCAL-Standard (1982) 
nicht unterstützt. 


PL1 oder PL/I (Programming Language 1) 

Mitte der Sechziger Jahre bei IBM entwickelte universelle Programmiersprache - sıe 
vereinigt Elemente von ALGOL-60, COBOL und Fortran und besitzt einen sehr großen 
Sprachumfang. Allerdings hat PL/I über den Mainframe-Bereich hınaus kaum Bedeutung 
erlangt. 
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3. HARDWARE 


Der Aufbau eines modernen Rechners” nach dem sogenannten von-Neumann-Prinzip lässt 
sich schematisch wie folgt darstellen. 


Zentral- 


einheit Datenwege 
Haupt- Zentral- 
prozessor 
speicher (CPU) 
Arbeits- Festwert- 
speicher speicher Rechenwerk 


(RAM) (ROM) 


Bild: Schema der von-Neumann-Rechnerarchitektur 


°° Meist stellen wir uns heutzutage darunter einen PC (Personal Computer) oder höchstens noch einen Apple Macintosh 


(„„Mac”) vor! 
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Taktgeber 
Leit-/Steuerwerk (Control Unit) Prozessor, 
Zentral- 


prozessor 
' CPU 
Es 
Processing 
Rechenwerk (ALU, arithmetical logical unit) Unit) 
1) 
> 
= Haupt- 
® s 
= Zentral- / Hauptspeicher Se 
=, "von Neumann Architektur": (Random 
. Programme und Daten 
Access 
Memory) 


Peripherie (Festplatte, Drucker, Tastatur, 


Maus, CD-Laufwerk, Scanner usw.) 


Schließlich wird ebenfalls über den externen Bus die gesamte Peripherie angesprochen: dazu 
gehören auch ın das PC-Gehäuse eingebaute Komponenten wıe Festplatten oder die 
Graphikkarte, aber auch gesondert angeschlossene Geräte wıe der Monitor, dıe Tastatur, dıe 
geliebte Maus, der Drucker, das Modem, der Scanner u.v.a.m. 


3.2. Datenein- und -ausgabe 


Maßgeblich für die Kommunikation zwischen Mensch und Computer sind dıe zur Verfügung 
stehenden Möglichkeiten der Datenein- und -ausgabe, auf die ın diesem Abschnitt 
eingegangen werden soll. 
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3.2.1. Dateneingabe 


Die Dateneingabe in die DV-Anlage steht am Anfang des EV A-Prinzips”'. Die Dateneingabe 
erfolgt 


= indirekt über Datenträger, 
= halbdirekt vom Urbeleg (Originalbeleg) oder von Identifikationskarten oder 


= direkt, und zwar automatisch, manuell oder akustisch. 


Dateneingabe 
Indirekte Halbdirekte Direkte 
Dateneingabe Dateneingabe Dateneingabe 
j Automatische Manuelle Akustische 
Urbeleg Plastikkarten Direkteingabe Direkteingabe Direkteingabe 
Online- 2 
Dialog- 
Daten- : 
eingabe 
erfassung 


3.2.1.1. Indirekte Dateneingabe 


Bei der indirekten Dateneingabe geht der eigentlichen Dateneingabe eine manuelle 
Datenerfassung auf Datenträger voraus und zwar auf gelochte Datenträger (Lochkarte, 
Lochstreifen) oder auf magnetische Datenträger (Diskette, Magnetband, Magnetband- 
kassette). 


3.2.1.2. Halbdirekte Dateneingabe 


= dıe Daten werden von Urbelegen, auf den sıe als Markierung (z. B. EAN) oder ın Form 
von Handblock- oder Maschinenschrift aufgezeichnet sınd, mıt Lesegeräten unmittelbar 
in die DV-Anlage eingelesen 


= dıe Daten werden mit Plastıkkarten (Scheck-, Ausweis- oder Krankenversicherungskarte) 
auf denen sıe auf einem Magnetstreifen oder ein Chip codiert sind, mit spezielle 
Lesegeräten ın die DV-Anlage eingelesen. 


3.2.1.3. Automatische Direkteingabe 


Eingabewerte werden von Sensoren erfasst und direkt an dıe DV-Anlage weitergeleitet 
(PDE = Prozeßldatenerfassung). 


>! EVA: Eingabe - Verarbeitung - Ausgabe 
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3.2.1.4. Manuelle Direkteingabe 


Manuelle Direkteingabe erfolgt 
= mit Tastaturen (ggfs. mit Zusatzgeräten wıe Maus, Trackball etc), 
= mit dem Lichtstift am graphischen Bildschirm oder 


= durch Berührung mit dem Finger an Touchscreens. 


3.2.1.5. Akustische Direkteingabe (Spracheingabe) 


Die akustische Direkteingabe (Spracheingabe) erfolgt über Mikrophone möglicherweise ın 
Verbindung mit einer Funkübertragung. Der DV-Anlage müssen Geräte zur 
Sprachumwandlung vorgeschaltet seın. 


3.2.1.6. Wirtschaftlichkeit der Dateneingabe 


Das Thema Wirtschaftlichkeit der Dateneingabe wırd ın der Praxis häufig unterschätzt. Wenn 
die Daten dort wo sıe anfallen, eingegeben werden sollen, setzt dieses möglicherweise 
Standleitungen. Deshalb ıst Dateneingaben immer unter dem Aspekt der Wirtschaftlichkeit 
zu betrachten, wobei Dateneingabe und Datenausgabe zusammen betrachtete werden müssen. 
Hinsichtlich der Dateneingabe sınd folgende Fragen zu stellen: 


= Wo fallen dıe Daten an? 
Beispiele: Büro, Werk, Kasse, Schalter; zentral, dezentral, ortsfest/mobil. 


= Wie fallen die Daten (gegenwärtig) an? 
Beispiele: Orıginalbeleg, z. B. Eingangsrechnungen, Durchschläge, z. B. bei Ausgangs- 
rechnungen, spezielle Erfassungsbelege, beleglos, etwa bei Scheckkarteneingabe oder 
Tastaturbedienung; 


= Wann und wie oft fallen die Daten an? 
Beispiele: periodisch, unregelmäßig, auf Anforderung; 


= Wie viele Daten fallen an 
Beispiele: hoher/niedriger, gleichmäßiger/ungleichmäßiger Anfall, Spitzenbelastungen. 


= Wie schnell müssen welche Daten wo verarbeitet werden und wo zur Verfügung stehen? 
Beispiele: Lagerbestände beim Einkauf, Bestellungen beim Vertrieb, Gehaltsnachweise 
beim Mitarbeiter, Kennzahlen beı der Geschäftsleitung. 


= Wo und wıe oft müssen Daten aktualisiert werden („gepflegt”) werden. 
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Überlicherweise werden folgende Ziele verfolgt: 


= Vermeidung von Mehrfacherfassung derselben Daten. Lösungen bieten der Datenträger- 
austausch und der elektronische Datenaustausch, auch zwischen Unternehmen. 


= Reduzierung des Beleganfalls durch andere Eingabetechniken reduziert. Typische 
Beispiele hierfür sind Krankenversicherungskarten, Elektronic Cash, Telebankıng, 
Direkteingabe mit Notepads (z. B. bei UPS), und die Automatisierung von Erfassungs- 
vorgängen, beispielsweise bei computergestützen Lagerverwaltungsssytemen. 


3.2.2. Datenausgabe 
Die Ausgabe von Daten kann 
= indirekt, d. h. in (nur) maschinell lesbarer Form oder 


= direkt, d. h. ın viısueller Form oder ın akustischer Form 


Indirekte Direkte 
Datenausgabe Datenausgabe 
isuelle Akustische 
Datenausgabe Datenausgabe 
Bildschirm- Druck- COM- Sprach- Sprach- 
Anzeige Ausgabe Verfahren Wiedergabe synthese 


3.2.2.1. Indirekte Datenausgabe 


erfolgen. 


Die Ausgabe ın maschinell lesbarer Form dient der Zwischenspeicherung 
- für eine spätere Weiterverarbeitung oder 


- für eine spätere Datenausgabe ın visuell lesbarer Form (meistens auf einem Drucker). 
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3.2.2.2. Direkte Datenausgabe 


Die Datenausgabe ım engeren Sinne ist die direkte Ausgabe ın vısueller Form und zwar 
® auf dem Bildschirm, 
= auf Papier über Drucker oder Plotter oder 


= auf Mikrofilm (COM = Computer Output on Microfilm) 


3.2.2.3. Akustische Datenausgabe 


Bei der aktustischen Datenausgabe (Sprachausgabe) werden zweı Verfahren unterschieden 


= Halbsynthese: Als Sprachmuster eingegebene Wörter oder Wortfolgen werden digital 
gespeichert und zur Ausgabe wieder ın analoge Schwingungen umgewandelt 
(Sprachwiedergabesysteme). 


= WVollsynthese: Digital gespeicherter Text wırd anhand von Sprachlauten, die als 
sogenannte Phoneme (Sprachlaute) oder Diphone (Lautübergänge) gespeichert sınd, ın 
Sprachsignale umgewandelt (Sprachsynthesesysteme). 


In Betracht kommen für die Datenausgabe 

= der Versand von DV-Ausdrucken (Drucklisten), 

® das Verschicken von Fernkopien der Drucklisten über Telefax, 

= der Versand von Datenträgern (Magnetband, Diskette, etc.), 

# der Versand von Microfiches, 

= die Datenübertragung über Netze mit Druck beim Empfänger oder 


® die Ausstattung der Empfänger mit Bildschirmterminals oder Mikrocomputern, mit denen 
der Empfänger über Fest und Funknetze auf die Daten zugreifen kann. 


Zusammen mit der Dateneingabe helfen folgende Fragen, die richtige Form der 
Datenausgabe zu ermitteln: 


= Wo und an wıe vielen Stellen werden die Daten benötigt? 
& Wie aktuell müssen dıe Daten seın? 
& Wie viele Daten sınd zu welchen Zeiten dafür zu übermitteln? 


= Wie oft verändern sıch dıe Daten? 
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3.3. Vernetzung 


Ein Rechnernetz (Rechnerverbundsystem) ıst ein Verbund mehrerer getrennt arbeitender, 
selbständiger Rechner, die durch einen Übertragungsweg (Leitung, Funk etc.) miteinander 
kommunizieren können. 


Weiter wird unterschieden zwischen einem lokalen Rechnernetz, LAN (local area network), 
und einem Rechnerfernnetze (WAN, wide area network)“. 


Bei einem Rechnerfernnetz, WAN, handelt es sich um Netze, in denen geographisch ‚weit 
entfernte” Rechner miteinander verbunden sind. Ein LAN dagegen besteht nach derzeitiger 
Rechtslage aus einem Netzverbund von Rechnern, die paarweise nicht weıter als 25 km 
voneinander entfernt sind. Relevant ıst dıe Tatsache, dass dıe Besitzer des Netzes (also ı. d. 
R. das Unternehmen) die Leitungen selbst verlegen und betreiben dürfen (im Gegensatz zu 
den öffentlichen Telekom-Netzen, die bis Ende 1997 dem Monopol unterlagen). 


In der sogenannten Verbundart unterscheidet man den Zweck der Rechnervernetzung: 


l. Last- oder Kapaziıtätsverbund 
Bei Aus- und Belastungsschwankungen hilft ein Teil der Netzrechner einem anderen aus. 


2. Geräte- oder Betriebsmittelverbund 
Es werden Peripheriegeräte von mehreren Rechnern gemeinsam genutzt, z.B. Drucker, 
dıe nıcht an jedem Rechner einzeln angeschlossen werden müssen (Prinzip der 
Printserver oder bei Peer-to-Peer-Verbindung). 


3. Funktionsverbund 
Nutzung von Programm(funktion)en, dıe auf einem anderen Computer verfügbar sınd 
(Application Server). 


4. Datenverbund 
Verteilte oder entfernt gelagerte Datenbestände werden (gemeinsam) genutzt (File Server, 
Database Server). 


5. Nachrichten- oder Kommunikationsverbund 
Informationen werden zwischen den Benutzern der einzelnen vernetzten Rechner 
ausgetauscht (Mail und News Server, Groupware (z. B. Lotus Notes)). 


Rechnernetze können graphisch durch Knoten- und Verbindungsstrecken visualisiert werden. 
Die einzelnen Knoten entsprechen dabeı den Rechnern, deren geographische Anordnung 
wırd als Netzwerktopologie bezeichnet. Die ım wesentlichen auftretenden Formen sınd 
nachstehend skizziert. 


°* Daneben kursieren auch Begriffe wıe MAN - metropolitan area network. 
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ir Ar u 


Linientopologie 


$ 09 


Ringtopologie 
Sterntopologie a. 


Bustopologie 


Bei der Sterntopologie ıst jeder Teilnehmer mit einem bestimmten Rechner, der Zentrale, 
verbunden (wıe bei einer Telefonanlage). Einsparungen von Leitungen und die leichte 
Erweiterbarkeit stehen der Abhängigkeit von der Zentrale (Überlast, Störungen, Ausfall) 
gegenüber. 


Bei der Ringtopologie sind alle Rechner gleichberechtigt, es gıbt keine Zentrale. Auch bei 
großer Teilnehmerzahl ıst der Leitungsaufwand gering; diese Struktur ıst allerdings anfällıg 
gegen hohe Belastungen und fällt (in der Regel ganz) aus, wenn ein Rechner nicht (mehr) 
läuft. 


Die Zinientopologie ıst ein Spezialfall der Ringstruktur, ein sogenannter offener Ring. 


Beı der sehr häufig praktizierten Bustopologie sınd die Teilnehmer über einen gemeinsamen 
Strang, den sogenannten Bus, miteinander verbunden. Auch bei Ausfall eines (beliebigen) 
Rechners können die anderen weiter miteinander kommunizieren. 


Eine übliche logische Einteilung der verschiedenen Schichten, die beim Netzwerkverbund 
zum Tragen kommen, wird durch das ISO Referenzmodell (Schichtenmodell)”° gegeben. 


7 | Anwendungsschicht | application Definition erlaubter Anwendungen: 
layer Datenbankabfrage, Prüfung von 
Zugangsberechtigungen, Buchung, allgemeine 
Rechnernutzung 
Darstellungsschicht | presentation | Festlegung der Bedeutung ausgetauschter 
layer Daten: 
Codierungen, Sprache, Graphik 
Kommunikatıions- session layer | Festlegung der Kommunikation zwischen den 
steuerungsschicht Teilnehmern ın Form von Sitzungen (sessıons): 
Steuerung des gesamten Benutzerdialogs vom 
Login bis zum Logout 


Transportschicht transport Steuerung und Überwachung der logischen 
layer Verbindung zwischen Sender und Empfänger 


> seit 1991 als DIN ISO 7498 genormt 
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Vermittlungsschicht | network Auf- und Abbau des gesamten physischen 
layer Übertragungsweges - Anwahl und Bestätigung 
des Verbindungsaufbaus usw. 
Sicherungsschicht link layer Sicherung der Schicht 1 - fehlergesicherte 
Übertragung (Fehlererkennung und 
Fehlerkorrektur) 


physikalische physical Ungesicherte Übertragung von Bitfolgen über 

Schicht layer eine Übertragungsstrecke; Vereinbarungen über 
Schnittstelle, die Übertragungsrate sowie die 
angewendeten Übertragungsverfahren 


3.4. Peripherie 


Unter Peripherie versteht man Geräte zur Ein- und Ausgabe von unterschiedlichsten Daten 
wıe etwa Tastatur, Bildschirm, Maus, Drucker, Scanner etc. aber auch Speichermedien wıe 
Disketten-, CD-ROM- und Festplattenlaufwerke. 


3.4.1. Eingabegeräte 


1. 


Tastatur 

Die Tastatur ıst zusammen mit dem Monitor (Bildschirm) dıe Standardschnittstelle 
zwischen Mensch und Rechner. Sıe ähnelt mit einigen Abweichungen der guten alten 
Schreibmaschinentastatur, die Belegung der einzelnen Tasten wird jedoch über das 
Betriebssystem gesteuert und kann auf diese Weise nationalen Zeichensätzen oder 
bestimmten Anforderungen angepasst werden. Jede Taste liefert einen eigenen 
sogenannten Scan-Code, der auch Tastenkombinationen erkennen lässt. Die meisten 
Tasten können daher in zwei- oder dreifachen Kombinationen verwendet werden (mit den 
jeweiligen Sondertasten). So schließt zum Beispiel die Tastenkombination [Alt]+[F4] 
unter Windows üblicherweise ein Programm. 


Maus 

Die Maus dient zur Manipulation von graphikorientierten Oberflächen und Texten. Man 
kann mit ıhr einerseits die Cursorposition am Bildschirm verändern, andererseits durch 
das sogenannte "Anklicken" bestimmte Programmaktivitäten hervorrufen. Für viele 
Softwarepakete zählt dıe Maus zur Hardware-Voraussetzung, bzw. wırd eine Arbeit ohne 
sie außerordentlich mühsam. 

Um arbeiten zu können, benötigt dıe Maus spezielle Programme (zusätzlich zu den 
Anwenderprogrammen), die Treiber genannt werden. Bei diesen ıst besonders auf 
Kompatibilitätsprobleme zu achten. 


Trackball 
Der Trackball kommt besonders beı Notebook- und Laptop-Computern zum Einsatz und 
manipuliert - ähnlich wıe dıe Maus - die aktuelle Cursorposition. 


Scanner 

Scanner sind Geräte, dıe es ermöglichen, Vorlagen unterschiedlichster Art optisch 
abzutasten und als graphische Information am Computer zu verspeichern. Man 
unterscheidet insbesondere zwischen Handscannern und Flachbettscannern. 
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Scanner sind in der Lage, je nach Hersteller und Preis, Schwarzweiß- oder Farbvorlagen 
in nahezu beliebiger Auflösung zu digitalisieren. Als Ergebnis eines solchen 
Abtastvorganges entsteht eine Graphikdatei, die unterschiedliche Formate aufweisen 
kann und - ın Abhängigkeit von der Auflösung der Vorlage und des verwendeten 
Dateıformates - von erheblicher Größe sein kann. Das Standardformat beim Scannen ist 
das Tagged Image File Format (TIFF°*). 


3.4.2. Ausgabegeräte 


l. Monitor (Bildschirm) 
Der Monitor dient zur Ausgabe von Texten oder Graphiken und benötigt zu deren 
Darstellung eine Bildschirmkarte, die ın die Hauptplatine des Computers eingesteckt ist. 
Man unterscheidet bei der Darstellung zwischen Text- und Graphikmodus. 
Entscheidend für die Qualität einer Bildschirmdarstellung sind die verwendete Auflösung 
in Pıxeln (Bildpunkten), die Bildschirmgröße und dıe Farbtiefe; daneben spielen beim 
Monitor der sogenannte Lochabstand und die Strahlung eine Rolle. Verbindungsglied 
zwischen dem eigentlichen Rechner und dem Bildschirm ist die Graphikkarte. 
Die heute üblichen Bildschirme besitzen eine Bildschirmdiagonale von 17 Zoll und 
können eine Auflösung von mindestens 640 x 480 dpi (dots per ınch) darstellen beı einer 
Lochgröße von ca. 0,28 mm. 
Im Bereich der Graphikkarten existieren sehr vıele Anbieter mit unterschiedlichsten 
Standards. Im Bereich der PCs sind bzw. waren u.a. gebräuchlich der CGA-Standard (mit 
stolzen 16 Farben), der VGA-Standard (mit den o.e. 640x480-Auflösung und einer 
Farbtiefe von 256 Farben) sowie der SVGA-Industriestandard mit 1024x768 Punkten und 
ca. 16 Millionen Farben. 
Daneben gibt es noch sehr leistungsfähige Graphikkarten mit Auflösungen über 
1240x1024 dpi, die auch auf Workstations zu Anwendung kommen. 


2. Drucker 

Die Sıtuation am Markt ıst bei Druckern noch unübersichtlicher als bei der PCs 
insgesamt. Für jede Anwendung und nahezu jede Preisklasse gibt es eın 
unüberschaubares Angebot von Druckern unterschiedlichster Qualität. Grundsätzlich 
kann bei modernen Druckern unterschieden werden (u.a.) zwischen Nadeldruckern (z.B. 
heute noch für Belege mit Durchschlägen erforderlich), Tintenstrahldruckern und 
Laserdruckern. Zur Bewertung eines Druckers sind u.a. dıe Druckgeschwindigkeit, das 
Schriftbild oder dıe Graphikqualität sowie ggf. dıe Farbdarstellung heranzuziehen. 


3.4.3. Speichermedien 


l. Disketten und Diskettenlaufwerke 
Die leicht transportablen Disketten werden auch Floppy Disks genannt. Sıe sind dünne, 
aus Magnetfolie produzierte Scheiben ın unterschiedlichen Hüllen und ın verschiedener 
Größe. Je nach Größe der jeweiligen Diskette und der Dichte ıhrer Spuren können 
bestimmte Datenmengen gespeichert werden. 
Heute sınd ım wesentlichen noch zwei Diskettentypen mit dem Format 3,5 Zoll ın 


»* Die übliche Dateinamenerweiterung unter DOS/Windows hierfür ıst .TIF, da längere Erweiterungen erst mit Windows 
NT bzw. 95 möglıch geworden sınd. 
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Verwendung: die einfacheren mit einer Kapazıtät von 720 Kiılobyte und die „high 
density”-Disketten mit einem Fassungsvermögen von 1,44 Megabyte. 

Disketten werden vor allem zum Transfer kleinerer Datenmengen, als 
Installationsmedium für Anwenderprogramme und in geringerem Umfang auch noch zu 
Sicherungszwecken (vor allem im Hausgebrauch) verwendet. 

Disketten haben eine begrenzte Lebensdauer; sıe sollten vorsichtig behandelt und nicht 
auf einer Heizung oder neben dem Fernseher aufbewahrt werden. 


2. Festplatten 
Festplatten oder englisch Harddisks gestatten das Speichern umfangreicher Programme 
und Daten. Festplatten sınd prinzipiell abgeschlossene Miniatur-Magnetplattenlaufwerke, 
also eine Einheit aus Laufwerk und Speichermedium. 
Die Speicherkapazitäten beginnen heute bei einigen hundert MByte und reichen bis ın 
den GByte-Bereich, wobeı die Faustregel gilt, dass mit zunehmender Größe der Festplatte 
dıe Zugriffszeit abnımmt. Marktübliche Zugriffszeiten liegen heute zwischen ca. 8 und 20 
Millisekunden. 
Festplatten bestehen aus einem Stapel einzelner, in der Regel beidseitig beschichteter 
Aluminmumscheiben, zwischen denen sıch Schreib- und Leseköpfe befinden. Da der 
Abstand zwischen Speichermedien und den Köpfen extrem knapp ist, müssen Festplatten 
von Erschütterungen und Verunreinigungen geschützt werden. Wıe auch beı der Floppy 
Disk benötigt eine Festplatte einen Harddisk-Controller, wobei auch hier aufgrund der 
unterschiedlichsten Standards auf die Kompatıbilität zu achten ist. 
Die wichtigsten Typen von Festplatten ım PC-Bereich sind IDE-Platten und 
SCSI-Platten. 


3. USB-Sticks 
An dem seit einigen Jahren üblichen USB-Anschluss (universal serial bus) hat sich ein 
etwa feuerzeuggroßes Gerät etabliert, der sogenannte USB-Stick. Dabeı handelt es sıch 
um einen permanenten Datenspeicher, der über die USB-Schnittstelle mit dem Computer 
kommuniziert. USB-Sticks gibt es ın verschiedenen Speichergrößen - von 16 MB bis 
über 1 Gigabyte. Einige benötigen eine separate Stromversorgung, andere können über 
den USB-Anschluss mit Strom versorgt werden. 


4. Weitere Speichermedien 

Neben Disketten und Festplatten sind heutzutage CD-ROMs (compact disc, read only 
memory) üblich; dabei handelt es sich (wie bei Musik-CDs) um (für den 
Normalanwender) nur lesbare”’ Medien, die insbesondere zur Auslieferung von Software 
und ım Multimedia-Bereich eingesetzt werden. 

Sogenannte Zıp-Laufwerke sind ein weiterer Versuch, diskettenähnliche Medien zum 
Einsatz zu bringen; allerdings sınd derzeit die verwendeten Formate beı Zıp-Laufwerken 
stark herstellerabhängig, was den Austausch solcher Medien erschwert. 


> Es seinur am Rande erwähnt, dass es seit geraumer Zeit auch sogenannte „CD-Brenner” gibt, mit denen CD-,‚Rohlinge” 
einmal beschrieben werden können. Wie fast alle Technologien so ıst auch diese ın den vergangenen Jahren preislich für 
Otto Normalverbraucher immer erschwinglicher geworden. 
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3.4.4. Kommunikationsschnittstellen 


1. 


Serielle Schnittstellen 

Die serielle Schnittstelle (auch V.24, RS232 oder RS422-Schnittstelle genannt) erlaubt 
dıe serielle Datenübertragung ım synchronen oder asynchronen Modus. Die einzelnen 
Bits (eines Bytes) werden dabeı hintereinander auf einer Leitung übertragen. Für diese 
Übertragung müssen beide Geräte (Sender und Empfänger) auf gleiche Weise eingestellt 
sein. parametrisiert sein. 

PCs verfügen häufig über zwei serielle Schnittstellen, die dann als COMI und COM2 
bezeichnet werden. Gegebenenfalls werden weitere serielle Schnittstellen dann mit 
COM3, COM4 usw. bezeichnet. 


Parallele Schnittstellen 

Die parallele oder sogenannte „Centronics”-Schnittstelle wird fast ausschließlich für den 
Betrieb von Druckern verwendet. Dabeı werden bis zu 8 Bit (eines Bytes) parallel auf 8 
Leitungen übertragen, was ım Idealfall eine achtfache Geschwindigkeit der seriellen 
Übertragung bedeutet. Hierbei können jedoch nur kurze Distanzen (zwei bis maximal 
fünf Meter) überbrückt werden. Beı Personal Computern (unter MS-DOS, OS/2 und 
Windows) heißen diese Schnittstellen LPT1, LPT2 usw., wobei ın der Regel heute nur 
noch eine parallele Schnittstelle LPT1 vorhanden ist, die auch mit PRN bezeichnet wird. 
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A. ALGORITHMEN UND DATENSTRUKTUREN 


In diesem Kapitel wollen wır uns mit Grundlagen beschäftigen, die für die 
Software-Entwicklung, zum Teil aber auch für das Erstellen komplexer Daten- und 
Beziehungs- und Objektmodelle von großer Bedeutung sind. Eine der ältesten und gängigsten 
Literaturempfehlungen hierzu ist das Buch von [Wirth]. 


Wir beginnen mit Datenstrukturen, dıe heutzutage von Standard-Programmiersprachen 
bereits zur Verfügung gestellt werden”. 


4.1. Grundlegende Datenstrukturen 


Werden in einer höheren Programmiersprache”’ Variablen (Speicherplätze) angelegt, dann ist 
es üblich, diesen einen sogenannten Datentyp zuzuordnen. Darunter versteht man die 
Festlegung einer Wertemenge, aus der die Variable zu jedem Zeitpunkt genau einen Wert 
annehmen oder besıtzen kann. Welchen Speicherplatz, d.h. welche Anzahl von Bits, eine 
Varıable eines gewissen Datentyps benötigt, dies hängt ım wesentlichen von der 
Kardinalität” der zugrunde liegenden Wertemenge ab. 


4.1.1. Einfache Datentypen 


Betrachten wir dıe Programmiersprache (ANSI-)C. Dort finden wır (u.a.) dıe vordefinierten 
einfachen Datentypen char, int und float. Dabeı handelt es sıch um Typen, mit denen 
jeweils ein einzelnes Zeichen” (des ASCII-Codes), eine ganze Zahl bzw. eine 
Gleitkommazahl abgespeichert werden können (vgl. hierzu Abschnitt 1.5.1 auf S. 33 zur 
Codierung von Zahlen). 


In jeder Programmiersprache gelten Regeln, dıe es erlauben festzustellen, von welchem 
Datentyp ein bestimmter Ausdruck, eine Konstante oder eine Variable ıst. Bei jeder 
Operation sınd ein oder mehrere Operanden bestimmter Datentypen beteiligt, und die 
jeweilige Programmiersprache legt fest, welche Datentypen mit welchen verträglich sınd und 
wıe der Ergebnisdatentyp aussieht. 


In 
[ex 


Naturgemäß stellt nicht jede Programmiersprache alle Datenstrukturen bereit, hıer ıst es dann besonders wichtig, dass 
(angehende) Wiırtschaftsinformatiker/innen ın der Lage sınd, diese Datenstrukturen eigenständig zu modellieren! So 
verfügt beispielsweise C nıcht über einen eigenen Datentyp zur Implementation von Mengen. 

Wir werden nachfolgend die Sprachen C und Pascal für Beispiele heranziehen; ın den meisten Fällen ıst dıe konkrete 
Programmiersprache jedoch nicht entscheidend. 


[9,7 
00 


Die Kardinalıtät einer Menge ist die Anzahl der Elemente dieser Menge bzw. © ım Falle von unendlichen Mengen. 
An dieser Stelle soll nıcht von Interesse sein, dass ın C eine char-Varıable intern rein numerisch gespeichert wird, und 


In 
Ve) 


dass mit ıhr auch ebenso wıe mit einem int gerechnet werden kann. 
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4.1.1.1. Numerische Datentypen: Ganze und Gleitkommazahlen 


Hierzu wieder ein Beispiel: bleiben wir ın C, dann erläutert der nachfolgende Code-Auszug 
einiges zu der hier erwähnten Typenverträglichkeit. 


ine 1=1,.7=2,0K=3} i, | und k werden als int-Speicherplätze deklariert und 
definiert. 

float x=1, y=2; x und y entsprechend als £loat. 

ee Die Addition zweier int-Werte ergibt naturgemäß wieder 
einen Wert vom Typint. 

x=kKk Und eine Ganzzahl kann an eine Gleitkomma-Variable 


zugewiesen werden, hierbei wird die interne Darstellung 
automatisch konvertiert. 

u Hier findet zunächst dıe Division von i mit j statt. Da beides 
int-Varıiablen sind, handelt es sich hier (bei der 
Programmiersprache C) um eine Ganzzahldivision „modulo”, 
d.h. das Ergebnis ıst hıer 0. 
Dieser (Ganzzahl-)Wert O0 wird dann an die £float-Varable 
zugewiesen, wobei wiederum automatisch ın die 
Gleitkommadarstellung konvertiert wird. x hat aber dann den 
Wert O -nıcht 0.5 ! 

i = 3.1415926; Die rechte Seite dieser Zuweisung ist eine Gleitkommazahl; 
lınks von der Zuweisung steht die Angabe einer 
Ganzzahl-Varıablen.. In manchen Programmiıersprachen, 
beispielsweise Pascal, ıst dies ein Fehler! In anderen Sprachen 
(wıe auch C) wırd diese Typenprüfung nicht so streng gesehen, 
vor der Zuweisung wird aber der Wert 3.1415926 abgeschnitten 
(„trunkiert”, „truncated”), i erhält „nur” den Wert 3. 


Bereits ın dieser Aufstellung sind zwei einfache Datentypen aufgetreten. Einmal der ın C 
int genannte Typ für dıe Darstellung und Verarbeitung ganzer Zahlen. Und dann als 
zweites eın Datentyp zur Abspeicherung von (Gleit-)Kommazahlen (beispielsweise 1,23 - 
wobei es ın der Programmierung üblich ist, hierfür 1.23 zu schreiben, also den Punkt statt des 
Kommas als Dezimaltrennzeichen zu verwenden). In C werden Gleitkommazahlen durch die 
Datentypen float und double repräsentiert°. Hierzu und für das weitere sei auch auf 
Abschnitt 1.5.1 auf Seite 33 hingewiesen. 


4.1.1.2. Zeichen und Zeichenketten (Strings) 


Auch wenn ım Digitalrechner letztlich alle Daten als Sequenzen von „0” und „1” abgelegt 
sind, so handelt es sich ınhaltlıch doch sehr häufig um nıcht-numerische Informationen. 


Wichtigstes Beispiel sind Zeichen und Zeichenketten - beispielsweise 'a' oder 
"Wiırtschaftsinformatık". Ein einzelnes Zeichen wird üblicherweise durch einen vereinbarten 


°° Der Unterschied dieser beiden Datentypen besteht in der zur Verfügung gestellten Speicherbreite, auf die wir ın diesem 
Rahmen jedoch nıcht weiter eingehen wollen. Ebenso bietet ANSI-C neben dem hier erwähnten Ganzzahltyp int noch 
einen weiteren namens long oder long int; aber auch dies wollen wır an dieser Stelle nicht weiter behandeln. 
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Code numerisch dargestellt’. Eine Zeichenkette wird dann im wesentlichen durch die 
Sequenz der einzelnen Zeichen repräsentiert”. 


u En EEE 7 gen rm Es) (ren IE | 


Position In a en 617 0 | ıı | 


5 
. Zeichen(kett 0; | 
Ba DW I ML, 0 m me em 
gespeicherte Zahl | 87 105 | 108 | 108 | 107 | 111 | 109 | 109 | 101 | 110 | 33 | 


ee) 
Ne) 


Die Skizze illustriert dies beispielhaft auf der Grundlage der Codierung gemäß ASCH. So 
wırd das Zeichen 'W' durch die (dezimale) Zahl 87 (hexadezimal: 0x57 =5 * 16 + 7) 
dargestellt, ebenso entspricht dem 'ı' die Codierung durch die Zahl 105. 


Das bedeutet aber im Umkehrschluss: sieht man ın einen Speicherplatz hinein, so findet man 
dort immer Bitfolgen, also Sequenzen aus "0" und "1"; wie diese dann zu interpretieren sind, 
wird ausschließlich über dıe Datentypen geregelt! Steht an einer Speicherstelle die Bitfolge, 
dıe der hexadezimalen 57 entspricht, dann kann dies dezimal 87 bedeuten, nämlich dann, 
wenn es sich um einen Speicherplatz handelt, der einen ganzzahlıgen Datentyp repräsentieren 
soll. Die hexadezimale 57 kann aber ebenso für das Zeichen 'W' stehen, sofern der Datentyp 
angıbt, dass dıe betreffende Information gemäß ASCIH codiert seın soll. 


4.1.1.3. Aufzählungstypen (Enumerations) 


Etwas weniger nutzen Software-Entwickler die Möglichkeit zahlreicher 
Programmiersprachen, eigene sogenannte Aufzählungstypen zu deklarıeren, mit denen der 
Code wesentlich selbstsprechender gestaltet werden kann. 


Hierzu ein konkretes Beispiel (wiederum in C°°). Nehmen wir an, wir wollten etwas für die 
sieben Tage der Woche codıeren. Dann lägen folgende Fragmente recht nahe. 


int wochentag=0; /* 0 steht für Montag */ 


for (wochentag=0; wochentag<=6; wochentag++) 


{ 


if (wochentag==6) 


/* hier nun der Code fuer den betreffenden Wochentag */ 


printf(”Heute ist Sonntag!”) 


61 Wie bereits erwähnt: im ASCII wird das Zeichen ‘A’ repräsentiert durch die Dezimalzahl 65. 

„Im wesentlichen” soll bedeuten, dass es - je nach Programmiıersprache - zu einer Zeichenkette entweder noch die 
Informatıon geben kann, wie lang sıe ıst, oder aber (wıe ın C) mit einem speziellen Abschlusszeichen das Ende markiert 
wird. 

Auch Pascal bietet Aufzählungstypen an; hier kontrolliert der Compiler sogar noch sehr viel stärker als ın C, dass die 
Werte des Datentyps eingehalten werden. 
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Sehr viel lesbarer wird der Code dagegen bei Verwendung eines Aufzählungstyps°*: 


enum wochentagstyp 


montag, dienstag, mittwoch, donnerstag, freitag, samstag, sonntag 


enum wochentagstyp wochentag; 


for (wochentag=montag; wochentag<=sonntag; wochentag++) 


{ 


if (wochentag==sonntag) 


/* hier nun der Code fuer den betreffenden Wochentag */ 


printf(”Heuüte ist Sonntagl”); 


Je nach Programmierssprache und Compiler-Einstellungen überwacht das 
Entwicklungssystem hierbei auch darüber, dass keine ungültigen Werte verwendet werden. 
Auch dies ıst ggf. eın Pluspunkt gegenüber der zuerst gezeigten primitiven 
Ganzzahl-Variante. 


4.1.1.4. Pointer (Zeiger) 


Schließlich muss noch ein im Kern einfacher Datentyp vorgestellt werden, der aber vielen 
Anfänger(inne)n der Programmierung alles andere als einfach fällt: der Pointer- oder 
Zeigertyp. 


Die nachfolgende Skizze illustriert den grundlegenden Sachverhalt. 


oO 00 = . 


Die hier dargestellten Variablen (Speicherplätze) a und b beinhalten nicht selbst 
„ıinteressante” Werte, sıe dienen vielmehr dazu, auf andere Speicherplätze zu verweisen (zu 
„zeigen’). In technischer Hinsicht beinhalten Variablen eines Pointertyps also 
Speicheradressen. 


Erweitern wır das obıge Bıld, dann können wir (fiktive) Adressen für die rechts dargestellten 
Speicherplätze angeben, hier die Nummern 1000 bıs 1004. Die übliche Sprechweise ıst: der 
Pointer a zeigt auf den Speicherplatz 1000, ın dem dıe Zahl „5” gespeichert ıst. Damit wird 


6° Technisch wandelt der C-Compiler die hier festgelegten Namen um ın die Zahlen O bis 6; es bleibt also intern alles beim 
alten. Allerdings ıst m.E. der von Menschen zu lesende Quellcode sehr vıel verständlicher geworden. Insbesondere muss 
nicht kommentiert oder darüber nachgedacht werden, ob nun die Zahl 0 für den Montag oder für den Sonntag steht. 
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nıchts anderes ausgesagt, als dass ın der Pointervarıablen a die Adresse 1000 gespeichert 
steht; zusammen mit dem durch den Datentyp festgelegten Wissen, dass diese 1000 eine 
Adresse ım Speicher angibt, wird die obige Sprechweise deutlich. 


bl 1001 | 6  hoo 
7 002 
8  loo3 
9 1004 


4.1.2. Strukturierte Datentypen 


Unter einem strukturierten Datentyp versteht man einen Datentyp, bei dem sich die 
anzunehmenden Werte selbst zusammensetzen aus kleineren Einheiten. Im Gegensatz oder 
Vergleich dazu sınd die elementaren Datentypen eher afomar zu nennen. 


4.1.2.1. Array (Feld) 


Das bekannteste Beispiel eines strukturierten Datentyps ıst der Array- oder Feldtyp. Hierbei 
handelt es sich um eine Zusammenfassung von endlich vielen Komponenten desselben 
Grundtyps. 


Beispiel: Für eine Studiengruppe von zwanzıg Personen seien die (ganzzahlıgen) 
Punktezahlen der Informatik-Klausur festzuhalten. Sind dıe zwanzig Personen der Reıhe 
nach angeordnet (oder durchnummeriert), so genügt die nachstehend bildhaft dargestellte 
Information. 


I 02 3 4a 535 6 7 8 9 1 2 B MS ı 7 8 19 2% 
EIESESESESCHESKIESERENSESEIKIKGEHEREBEN 
Eingerahmt sınd zwanzıg Kästchen dargestellt, ın denen jeweils eine ganze Zahl Platz findet. 


Darüber steht der jeweilige Index. Das Ganze wırd Array oder Feld genannt, dıe Deklaration 
sieht ın Pascal wıe folgt aus. 


type arraytyp = array[1..20] of integer; 


Damit ıst zunächst nur der Datentyp deklariert worden, d.h. dıe „Absichtserklärung”, dass 
künftig mıt dem Namen arraytyp genau solche Gebilde verwaltet werden sollen. 


Einen konkreten Speicherplatz a mit dieser Struktur erhält man ın Pascal dann wie folgt. 


“ar .d 2 NSELAIVEVD; 
all] u. 
20] ze IE 
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Auch in C gibt es (natürlich) Arrays, allerdings beginnt dort die Indizierung immer bei 0. Das 
obıge Bild müsste also modifiziert werden, damit der nachfolgend gezeigte Code in ANSI-C 
korrekt veranschaulicht wird. 


0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 l 


5 16 17 18 19 
KIENSESESESKHECIEIESEREIEIESEIEZEEHETEHEIN 


Hierzu passt dann der folgende C-Code-Auszug. 


typedef int arraytyp[20]; 


arraytyp a; 


0; 
a2]. & 91T 


4.1.2.2. Record (Struct) 


Während beı einem Array stets gleichartige Komponenten zusammengefügt werden, dıe dann 
über einen ın der Regel numerischen Index angesprochen werden können, bietet ein Record 
(oder eine Struktur, ein struct, ein Verbund, - lauter synonyme Begriffe) die Möglichkeit, 
eine Einheit aus verschiedenartigen Komponenten zu bilden. Schon aus technischen Gründen 
sind dıese Komponenten dann aber nıcht mehr über einen Index sondern über einen 
jeweiligen Komponentennamen verfügbar. Solche Records treten beispielsweise beı 
Datenbanken auf, etwa wenn für einen Kunden dessen Nachname, Vorname und die 
Kundennummer verwaltet werden. 


In C kann dies dann so aussehen. 


/* Vereinbarung des Datentyps */ 
SETFUCLr. Kkunderntyp 
{ 

char nachname [80]; 

char vorname [80]; 

int kundennummer; 


hi 


/* Deklaration und Definition der Variablen */ 
struct kundentyp kundel, kunde2; 


kundel.kundennummer = 123;/* Zuweisung der Kundennummer fuer kundel * / 
puts (kunde2.nachname) ; /* Ausgabe des Nachnamen auf den Bildschirm */ 
kunde1 


nachname vorname kundennummer 
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4.1.2.3. Menge (Set) 


Außer Arrays und Records ıst ein dritter, häufig eingesetzter strukturierter Datentyp die 
Menge, englisch: set. Wie beim Array werden auch bei einer Menge gleichartige Dinge 
zusammengefasst. Während beim Array jedoch ein konkreter Wert auch mehrfach auftreten 
kann, ıst bei einer Menge mathematisch nur relevant, ob ein Element überhaupt vorkommt 
oder nıcht. Auch die beim Array mit verwaltete Reihenfolge spielt hier keine Rolle. Die 
Mengen A={1,2,3}undB={2,3,1,3 } sınd also ıdentisch. 


Die Programmiersprache C bietet keinen fertigen Datentyp für Mengen an, Pascal immerhin 
Mengen von einfachen Datentypen (mit einer je nach Compilersystem begrenzten 
Größenbegrenzung). Sehen wir uns also ein einfaches Beispiel einer Menge über der 
Grundmenge { 1,2, 3,4,5 } an. 


type mengentyp = set of 1. .5; { Mengen über der Grundmenge 1 .. 5 |} 
var mengel = mengentyp; 


] ;{ Zuweisung der leeren Menge, also der Menge, die kein Element beinhaltet |} 


mengel := [ 
= mengel + [ 1 ]; { Aufnahme der Zahl 1 in die Menge } 


mengel 
Werfen wır kurz einen Blick auf den Speicherbedarf einer Menge. Es mag auf den ersten 
Blick umständlicher und komplexer aussehen, als es wirklich ist. Wir benötigen ın der Tat 
nur für jedes Element der Grundmenge (hier ım Beispiel also {1,2,3,4,5}) eın Bit: dieses wird 


auf 0 gesetzt, wenn das betreffende Element nıcht ın der fraglichen Menge ıst, andernfalls auf 
1: 


Die Menge { 1, 3, 4 } wäre also durch die Bitfolge 10110 darzustellen. 


213 ]|4] 1" der Menge? 


5 
o0|ı1)717]0 


Mengen sind für dıe Software-Praxis eine sehr große Hilfe. Oftmals ıst es nıcht relevant, wie 
oft ein Ereignis eingetreten ıst, sondern nur, ob bzw. dass es eingetreten ist. In einer 
Applikation, die mehrere Fenster zur Bearbeitung zulässt, ıst es beispielsweise wichtig, ob ın 
einem Fenster Änderungen stattgefunden haben, damit beim Schließen des Fensters 
nachgefragt werden kann, ob gespeichert werden soll. Hierfür muss aber nıcht protokolliert 
werden, wieviele Änderungen es wirklich gegeben hat. 


4.1.2.4. Datei (File) 


Die bislang vorgestellten Datentypen haben alle eines gemeinsam: eine konkrete Realısierung 
hat nur endlich viele Werte, wobei die maximale Anzahl von vorneherein festgelegt ıst. Eın 
Array hat maxımal so vıele Einträge, wıe es bei der Deklaration mitgegeben bekommen hat. 
Ein Record hat nur die endlich vielen Komponenten, dıe bei der Deklaration explizit 
angegeben wurden. Eine Menge (in der EDV) schließlich ıst stets eine Menge über einer 
zuvor festgelegten endlichen Grundmenge°”. 


% Für den Mathematiker bedeutet dies natürlich sofort: nicht alle mathematischen Mengen sınd ın einem 
(Pascal-)Programm darstellbar. 
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Demgegenüber ıst eine Datei (englisch: ein file) vom Datentypkonzept her eine „beliebig 
lange” (faktisch schließlich wıeder endliche) Sequenz von Einzelwerten - meist Bytes (bzw. 
Zeichen)”. 


Man spricht von einer sequentiellen Dateı (und von sequentieller Dateiverarbeitung), wenn 
man - ähnlich wıe bei einem Videoband - die Informationen nur der Reihe nach von vorne 
nach hinten abspeichern bzw. lesen kann. Um den sıebten Datensatz abzurufen, muss man 
also gedanklich die ersten sechs Datensätze „vorspulen”. 


Daneben gibt es aber auch Dateı(art)en mit Direktzugriff, ım Fachjargon random access 
genannt. Hier kann - ähnlich wıe bei einem Array - gezielt ein einzelner Datensatz 
angesprochen werden. 


4.2. Dynamische Datenstrukturen 


Die bislang besprochenen Datentypen waren im wesentlichen statisch; einzige Ausnahme 
stellten in gewisser Weise Dateien dar, bei denen die Größe prinzipiell beliebig anwachsen 
konnte, wobei aber auch hier die Struktur (z.B. sequenzielles Verarbeiten) festgelegt wurde. 


Demgegenüber sind dynamische Datenstrukturen solche, bei denen erst zur Laufzeit 
(runtime) der erforderliche Speicherplatz (im Arbeitsspeicher) allokiert°” wird. Statisch 
reserviert wird im minimalen Falle lediglich eine Startadresse. 


Hierzu werden dıe bereits erwähnten Pointer (siehe Abschnitt 4.1.1.4. auf Seite 78) 
eingesetzt. Damit sınd Datenstrukturen möglich, die (erst) während des ablaufenden 
Programms angelegt werden und sıch dann auch noch verändern können - sprich: dynamisch 
sind. 


Kommen wır am besten gleich zu konkreten Beispielen. 


4.2.1. Einfach verkettete lineare Listen 


Unter einer linearen Liste versteht man eine Aufeinanderfolge von nıcht notwendigerweise 
gleichartigen Einträgen. Beispielsweise können Personen, dıe zu einer Gruppe gehören, ın 
eine solche Liste eingetragen werden. Dabeı kann jederzeit auch eın Sortierkriterium, z.B. 
nach Alter absteigend oder alphabetisch nach Nachnamen, berücksichtigt werden. An diesem 
Beispiel wollen wır einige Aspekte diskutieren. 


Gehen wir also davon aus, dass wır zu den Personen der Einfachheit halber nur den 
Nachnamen, den Vornamen und das Geburtsdatum speichern wollen. Dann sind wir 
inhaltlıch bei einem Record-Datentyp (struct ın C) angekommen; dessen Deklaration könnte 
in ANSI-C beispielsweise aussehen wie folgt. 


° Der wesentliche Unterschied: ein Array[1..20] ... hat definitiv zwanzig Speicherplätze des entsprechenden Basistyps; 
eine Datei kann zunächst einmal unbegrenzt anwachsen. Gleichzeitig - und dies ıst kein Widerspruch - ıst dıe Datei aber 
zu jedem Zeitpunkt natürlich nur von endlicher Länge. 

°’ Allokıeren bzw. Allokation von Speicherplatz bedeutet dessen Bereitstellen. 
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struct personentyp 


char nachname[40+1]; 
char vorname [30+1]; 
char geburtsdatum[10+1]; /* Darstellung: tt.mm.jjJjj */ 


' 


Von diesem Datentyp können nun auf statische Art und Weise einzelne Variablen oder auch 
ganze Arrays angelegt werden. 


struct personentyp personl, person2; 
struct personentyp personen [100]; 


Beide Varıanten bedeuten aber, dass bereits zur Compile-Zeit feststeht, wıeviele Personen 
maximal aufgenommen werden sollen bzw. können. Wir wollen aber "voll dynamısch" 
arbeiten können, d.h. erst zur Laufzeit des Programms soll faktisch entschieden werden, für 
wıeviele Personen wir wirklich den Speicherplatz benötigen; wır wollen aber auch nıcht 
durch etwa dıe maxımal einhundert Datensätze, dıe wır ın das obige Array personen 
maximal eintragen könnten, eingeschränkt werden. 


Die nachstehende Skizze zeigt das weitere Vorgehen. 


Start nachname vorname geburtsdatum naechster 
BE 17.03.1974 | NULL 


1.Datensatz 


Wir nehmen uns eine Pointervarıable namens Start, die auf den Wert NULL ınıtıalısıert 
wird, d.h. anschaulich zeigt Start zunächst auf nichts. Sobald dann die erste Person 
aufgenommen werden muss, wird Speicherplatz (vom Betriebssystem) angefordert und 
dessen Adresse Start zugewiesen. Da nach dieser ersten Person natürlich jederzeit noch 
weitere Personen aufgenommen werden können, muss es dabei wıederum eine 
Pointerkomponente (in unserer Skizze naechster genannt) geben, die zunächst ebenfalls 
auf NULL gesetzt wird. 


Hierfür wird also unser personentyp um eine solche Komponente naechster ergänzt. 
Die betreffenden Deklarationen werden für die Beispielsprache C nachfolgend 
wiedergegeben”. 


struct personeneintrag 


char nachname[40+1]; 

char vorname [30+1]; 

char geburtsdatum[10+l1]; 

struct personeneintrag * naechster; 


Hi 


struct personeneintrag * Start = NULL; 
/* NULL steht fuer "Zeiger auf nichts" */ 


°° An dieser Stelle können naturgemäß nicht alle Probleme der Programmiersprache C behandelt werden. Es seı hier nur 
daran erinnert, dass Zeichenketten in C mit einem Abschlussbyte '\0' markiert werden, - daher das "+1" ın den hier 
gezeigten char-Array-Deklarationen. 


Und mit der C-Notation datentyp * ptr; wird ptr als Variable vom Typ "Zeiger auf datentyp" vereinbart. 
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/* Aufnahme der ersten Person gemaess obiger Skizze */ 


/* Bereitstellen des Speicherplatzes mittels malloc() -Funktion‘ */ 
Start = (struct personeneintrag *)malloc (sizeof (struct personeneintrag)); 


/* Zuweisen der Daten von Berta Meier */ 
strncpy (Start->nachname, "Meier",40); 
strncpy (Start->vorname, "Berta",30); 
strcepy (Start->geburtsdatum, "17.03.1974"); 
Start->naechster = NULL; 


Hiermit erhalten wır die im vorher gezeigten Bild dargestellte Situation. 


Nun können aber jederzeit weitere Datensätze angehängt werden; in der nachfolgenden 
Skizze wurde ein Datensatz für Olga Schmidt ergänzt. (Der hierzu erforderliche Code bleibe 
dem Leser oder der Leserin überlassen.) 


Start nachname vorname geburtsdatum naechster 
meier 17.03.1974 
1.Datensatz 


2.Datensatz 


Aber lineare Listen haben noch einen weiteren positiven Aspekt: wollen wir die hier 
begonnene Liste nach Nachnamen alphabetisch sortiert verwalten, dann brauchen wir beı der 
Aufnahme eines Gustav Müller nıcht physisch Daten herumzuschieben, wir fügen einfach 
den entsprechenden Eintrag in die Liste ein. 


In der obigen Skizze heißt dies konkret: der Pointer naechster des 1.Datensatzes wırd auf 
einen neuen Speicherplatz derselben Grundstruktur gesetzt, dort wırd Gustav Müller 
eingetragen, und dessen naechster-Pointer wırd auf den zuvor schon vorhandenen 
Datensatz von Olga Schmidt gesetzt. 


Nach erfolgter Operation sıeht dıe Skizze unserer linearen Liste wıe folgt aus. 


° Da es hier nur um den wesentlichen Mechanismus geht, werden hier einige für die praktische Programmierung 
erforderlichen Fehlerabfragen nıcht abgedruckt. So könnte das Anfordern einer gewissen Menge Speicherplatz ın der 
Praxis natürlich auch scheitern. Hierauf wollen wır an dıeser Stelle Jedoch nıcht weiter eingehen. 
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Start nachname vorname geburtsdatum naechster 
meier 17.03.1974 
1.Datensatz 


2.Datensatz 


3.Datensatz 


4.2.2. Doppelt verkettete Listen 


Wenn Sıe das obige Beispiel aufmerksam verfolgt haben, wird Ihnen aufgefallen sein, dass es 
ein Kinderspiel ıst, dıe lineare Liste von Anfang bis Ende durchzuarbeiten: stets muss nur 
über den jeweiligen Nachfolger-Zeiger naechster zum nächsten Datensatz weitergegangen 
werden, solange bis dort NULL steht. 


Es ıst aber umgekehrt überhaupt nicht einfach: wıll man, aus welchem Grund auch immer, 
die Liste rückwärts durchlaufen”, dann wird man durch die Datenstruktur überhaupt nicht 
unterstützt. 


Für solche Fragestellungen bietet es sich an, neben dem naechster-Zeiger auch noch 
einen vorheriger-Zeiger zu verwalten. 


Start vorheriger nachname vorname geburtsdatum naechster 


BI NULL FOREER 


1.Datensatz 


2.Datensatz 


Letzter 


3.Datensatz 


Hierfür wäre auch unser Eintragstyp wie folgt anzupassen. Und es bietet sich aus 
Symmetriegründen an, einen Zeiger Letzter auf den jeweils letzten Datensatz zeigen zu 


"® Zum Beispiel möchte man die letzten drei Einträge bearbeiten... 
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lassen. Mittels Durchhangeln über die vorheriger-Zeiger kann nun die jetzt doppelt 
verkettete Liste ebenso bequem von hinten nach vorne abgearbeitet werden. 


struct personeneintrag /* für doppelt verkettete Liste */ 


struct personeneintrag * vorheriger; 
char nachname[40+1]; 

char vorname [30+1]; 

char geburtsdatum[10+1]; 

struct personeneintrag * naechster; 


4.2.3. Bäume 


Wir haben lineare Listen kennengelernt als Möglichkeit, dynamischen 
Speicherplatzanforderungen nachzukommen. Dabei ıst es Merkmal 
einer solchen linearen Liste, dass eine Information nach der anderen 
abgespeichert wird, also eine Abfolge der einzelnen Einträge 
vorliegt”. 


Betrachten wır jedoch das nebenstehende Bild. Dargestellt ıst eine _|] 
Verzeichnisstruktur, wie wır sıe alle kennen. Ausgehend von einem 

sogenannten Wurzelverzeichnis (root directory), das ın der DOS und Windows-Welt mit \ 
und ın der Unix- und Internet-Welt mit / notiert wird, sehen wır auf der Stufe darunter (bzw. 
in der graphischen Darstellung eine Ebene mehr nach rechts eingerückt) die 
Unterverzeichnisse (subdirectories) neuro, pgp und tmp. Unterhalb von neuro (bzw. 
wıederum eine Ebene weıter eingerückt) finden sıch dessen Unterverzeichnisse src und 
tmp; schließlich hat src wıederum eın Unterverzeichnis namens own. 


Es ıst augenscheinlich, dass hierfür eine lineare Liste keine adäquate Datenstruktur wäre, 
denn die Verzeichnisse pgp und own sind ım üblichen Sinne nicht vergleichbar. Die hier 
gezeigte Struktur wird ın Informatik-Kreisen Baumstruktur genannt. Wie eine Liste ıst auch 
ein Baum eine rekursive Struktur. Eine Liste ıst entweder die leere Liste (Start=NULL), 
oder sıe besteht aus einem ersten Knoten (Eintrag) und dem Rest, der wiederum eine Liste 
darstellt. Bei einer endlichen Liste ıst die Anzahl der Einträge insgesamt natürlich endlich. 


Entsprechend ist ein Baum entweder die leere Struktur oder ein Knoten, von dem aus endlich 
viele Verknüpfungen zu (Teil-)Bäumen (subtrees) gehen. Auch hierbei ıst ein endlicher 
Baum eine Struktur mit nur endlich vielen Knoten. 


Ähnlich wie bei der oben erwähnten Verzeichnisstruktur spricht man beim Einstiegsknoten 
von der sogenannten Wurzel (root) des Baumes. Es ıst üblich, ın der graphischen Darstellung 
eines Baumes diese Wurzel nach ganz oben oder nach ganz lınks zu setzen. 


Das oben gezeigte kleine Beispiel sieht ın einer anderen, klassıschen Visualisierung aus wıe 
folgt. 


"! Mathematisch gesprochen haben wiır in einer linearen Liste eine Ordnung: zwei verschiedene Einträge x und y kommen 
in einer speziellen Reihenfolge vor, sind in diesem Sınne auf jeden Fall vergleichbar. Entweder kommt x vor y oder y vor 
X. 
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Hierbei wird, von oben beginnend, zunächst dıe Wurzel des Baumes eingezeichnet. Durch 
Striche verbunden wird dann ın der Folgezeile dıe nächste Ebene dargestellt: die erste 
Kindgeneration der Knoten und Blätter. Ein Knoten ıst ein Eintrag, der selbst wieder 
mindestens einen eigenen Folgeeintrag auf der nächsten Ebene besitzt, ein Blatt ıst ein 
Eintrag, von dem aus keine weiteren Einträge vorhanden sınd. 


Auf der oben gezeigten ersten Ebene unterhalb der Wurzel ıst neuro eın Knoten, pgp und 
tmp sınd Blätter. Entsprechend ıst src eın Knoten, tmp eın Blatt auf der zweiten Ebene, 
schließlich ıst own das einzige Blatt auf der dritten Ebene unterhalb der Wurzel. Insgesamt 
besitzt dieser Baum vier Ebenen, wobei dıe Wurzel mit eingerechnet ist. 


Besitzt ein Baum die Eigenschaft, dass jeder Knoten höchstens zweı Nachfolge-Einträge 
besitzt, dann nennt man ıhn einen binären Baum. Eine lıneare Liste ıst, rein formal, ebenfalls 
ein Baum, allerdings einer, bei dem jeder Knoten nur einen Nachfolger besitzt, d.h. es 
handelt sıch dabei um einen entarteten Baum. 


Die Implementierung einer Baumstruktur erfolgt zum Beispiel in ANSI-C selbstverständlich 
wıeder mittels Pointerkomponenten ın einem entsprechenden Struktur-Datentyp. 
Nachstehendes Beispiel illustriert den Knoten eines binären Baumes, wobeı der eigentliche 
Dateninhalt auf eine Zeichenkette namens bezeichnung reduziert wurde. 


struct binaerbaumknoten 


{ 


struect binacrbaunknoren * Zinker terlbaun; 
char bezeichnung[128+1]; 
struct binaerbaumknoten * rechter teilbaum; 


Hi 


Neben der hier gezeigten Datentypvereinbarung wäre noch eine Variable wurzel für den 
Anfang des Baumes festzulegen. 


struct binaerbaumknoten * wurzel; 
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Bäume können u.a. dazu verwendet werden, Daten ın einer gewissen Sortierung zu verwalten 
und damit Suchvorgänge zu erleichtern. Nachstehend nur eine kurze Skizze, ın der dargestellt 
wird, wıe in einem binären Baum (exemplarisch) ganze Zahlen verwaltet werden können. 


Beispielhaft wurden hier die Werte 6, 12, 13, 16, 23, 35, 44 und 56 abgespeichert. Dabeı 
erfolgte die Abspeicherung so, dass für jeden Knoten gilt: ım linken Teilbaum stehen nur 
Werte, die kleiner sınd als der Wert ın dem betreffenden Knoten selbst; entsprechend sind ım 
rechten Teilbaum nur Werte zu finden, dıe größer sind. Die Wurzel trägt den Wert 16, ın 
ihrem linken Teılbaum sınd nur Werte kleiner als 16 zu finden: 6, 12 und 13. 


Wird nun ein konkreter Wert gesucht’“, so muss bei der Wurzel beginnend stets nur einer der 


beiden Teilbäume durchsucht werden. Wird der Wert 44 gesucht, so muss nicht die ganze 
Liste der Werte, beginnend bei 6, durchforstet werden. Vielmehr beginnt es mit dem Lesen 
des Wertes ın der Wurzel. Hierbei handelt es sıch um die 16, also einen Wert kleiner als 44. 
Das heısst: ıst 44 ım Baum enthalten, dann ım rechten Teılbaum der Wurzel. 


Geht man ın diesen rechten Teilbaum, so stößt man zuerst auf dıe 35. Wegen 35 < 44 muss 
wıederum der rechte Teilbaum des Knotens mit der 35 weiter verfolgt werden. In unserem 
Beispiel ıst der folgende Knoten bereits dıe 44, wır haben unsere Suche schon nach drei 
Vergleichen beendet! 


'® Das heisst, es stellt sich dıe Frage: "Ist ein bestimmter Wert ın dem Baum enthalten oder nıcht?" 
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4.3. Elementare Algorithmen 


In diesem Abschnitt soll es exemplarisch um einige elementare, zum Teil aber sehr häufig 
verwendete Algorıthmen gehen. Der Begriff Algorithmus wurde bereits in Abschnitt 2.1. 
(vgl. S. 54) definiert. Im wesentlichen handelt es sich um ein Kochrezept, wıe ein Problem zu 
lösen ıst. 


Zur Darstellung von Algorıthmen verwenden wır ım Folgenden zum Teil die (auf S. 57 ff 
vorgestellten) Nassı-Shneidermann-Struktogramme, zum Teil geben wir aber auch einen 
Quelltext(ausschnitt) ın Pascal oder C an. 


4.3.1. Vertauschen zweier Speicherinhalte 


Beginnen wır mit dem wohl elementarsten Mechanismus: dem Vertauschen zweier 
Speicherinhalte. 


Nehmen wır an, dıe Varıablen a und b seien von demselben Datentyp (stellvertretend 
nehmen wir hier ganze Zahlen als Beispiel), dann ıst es sehr häufig erforderlich, dıe Inhalte 
von a und b auszutauschen, etwa weıl man möchte, dass a den kleineren und b den größeren 
Wert beinhaltet. 


Dann ıst der einfachste Weg, diesen Tausch zu organisieren, eine Hilfsvarıable (namens 
hilf) desselben Datentyps bereitzustellen und "im Rıng herum" dıe Werte zuzuweisen: 


hHılt.e @: 
A eb 
B.- =; AHrlr: 


Man kann sıch sehr leicht davon überzeugen, dass anschließend a und b ıhre Werte 
ausgetauscht haben. 


4.3.2. Noch einmal: Vertauschen zweier Speicherinhalte 


Es gibt aber auch noch eine trıckreichere Variante, zwei Speicherinhalte auszutauschen, 
solange es sich nur um Werte handelt, mit denen gerechnet werden kann. Dann ıst sogar eın 
sogenanntes „/auschen am Platz” möglıch, das nachfolgend dargestellt wırd. Hierfür ıst dann 
kein dritter Speicherplatz erforderlich. Dafür muss etwas gerechnet (und für die Leserinnen 
und Leser: nachgerechnet) werden. 


a = a+tb; 
De sb; 
a = a-b; 


Um nachvollziehen zu können, dass dıeser kleine Algorıthmus tatsächlich das Gewünschte 
tut, nehmen wir uns am besten konkrete Werte her und verfolgen Schritt für Schritt die 
Werte, die in a bzw. b gespeichert werden. 
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Speicherbelegung: a b 
a = 15 1 
De 23 1 2 
a = a+rb; 3 2 
b= a-b; 3 1 
12 geb3 A | 


Wie man leicht sehen kann, haben a und b nach der Aktion ıhre Werte getauscht. 


4.3.3. Primzahlbestimmung durch Division 


Häufig muss auch festgestellt werden, ob eine gegebene natürliche Zahl n eine Primzahl ist, 
sich also nur durch 1 und sıch selbst ohne Rest teilen lässt. 


Nach kurzem Nachdenken stellt man fest, dass man nur testen muss, ob n sıch durch eine der 
Zahlen 2, 3, 4, ... sqrt(n) ohne Rest teilen lässt’. 


Im Struktogramm kann dies so aussehen: 


Solange i < Wurzel aus n und nicht nlstKeinePrimzahl 


nistKeinePrimzahl = ı teilt n ohne Rest 


Wenn istkeieprmzahl_ 


Ausgabe: "n ist keine Primzahl“ Ausgabe: "n ist Primzahl" 


Oder als C-Quellcode: 


/* i und n seien als int deklariert, n sei eingegeben worden */ 
Les 


nIstKeinePrimzahl = 0; /* Noch ist nichts bekannt... */ 
while ( i < sqrt(n) && !nlIstKeinePrimzahl ) 
nIstKeinePrimzahl = (n%i == 0); 
i = i+l; 


if (nIstKeinePrimzahl) 


{ 


Prınere'n I0e keine Primzail”); 


else 


{ 


PrIDeLI"N ı8E Eine Primzahl"); 


# Die Funktion sqrt (x) berechnet ın den gängigen Programmıersprachen zu einer nıchtnegativen Zahl x deren Wurzel. 
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Zur Erläuterung: mit der logischen Variablen nIstKeinePrimzahl wird festgehalten, ob 
bereits bekannt ıst, dass n keine Primzahl ist. Solange dies nicht der Fall ıst, werden über die 
Varıable i die Werte von 2 bıs Wurzel aus n getestet, ob sie Teiler von n sind. Mathematisch 
ist i ein Teiler von n, wenn n ein ganzzahlıg Vielfaches von i ıst, - bzw. wenn n geteilt 
durch i den Rest 0 lässt. 


So ıst 7 ein Teiler von 21, aber 12 ıst kein Teiler von 21. Und 23 ıst eine Primzahl, denn für 
dıe Zahlen 2, 3 und 4 lässt sich sofort nachprüfen, dass weder 2, noch 3, noch die 4 dıe Zahl 
23 teilen. Und damit ıst der Test auch schon beendet, denn die Zahl 5 ıst nıcht mehr kleiner 
als die Wurzel aus 23 (=4,7958...). 


4.3.4. Primzahlbestimmung mit dem Sieb des Eratosthenes 


Sind mehrere Zahlen daraufhin zu überprüfen, ob sıe Primzahlen sind, oder benötigt man 
mehrere Primzahlen, dann bietet sich ein weiteres Verfahren an: das sogenannte Sieb des 
kratosthenes. 


In Worten beschrieben funktioniert das Verfahren wie folgt. Angenommen, es werden die 
Primzahlen von 1 bıs n benötigt. Dann startet man mit der Menge aller natürlichen Zahlen 
von 2 bıs n einschließlich. Anschließend entfernt man aus der Menge alle Vielfachen der 
Zahl 2, belässt dıe 2 selbst aber ın der Menge. Die nächste Zahl - nach der 2 - die jetzt noch 
in der Menge ist, ıst die 3. Im nächsten Durchgang werden also alle Vielfachen der 3 aus der 
Menge entfernt, dıe 3 selbst jedoch bleibt wieder darın. Die 4 ıst bereits gestrichen worden, 
also ıst dıe 5 dıe nächste Zahl, dıe ın diesem Sıeb enthalten ıst. Alle Vıielfachen der 5 - ohne 
dıe 5 selbst - werden nun entfernt. Und so geht das Verfahren weiter, bis wır bei der Zahl n 
angelangt sınd. 


Etwas übersichtlicher lässt sich dıes als Struktogramm formalisieren. 


sieb := [ 2,3,4....,n-1,n ] 


solange | in sieb 


solange i*| <=n 


entferne i*j aus dem sieb 


| := nächstgrößere Zahl, die noch in sieb ist, falls vorhanden 


Nach Durchlaufen des Verfahrens’ enthält die Menge sieb genau die Primzahlen zwischen 2 
und n. So ist für n = 20 die Ergebnismenge” { 2, 3, 4, 5, 6, 7, 8,9, 48, 11, #2, 13, +4, 45, #6, 
17,48, 19,298} ={2,3,5,7,11, 13, 17,19 }. 


”* Der Algorithmus endet, sobald kein j kleiner oder gleich n mehr in dem Sieb vorhanden ist. 
> Sofern Sıe dıese Seite ın Farbe sehen: dıe blau markierten Streichungen sind bei dem Durchgang mit j = 2 erfolgt, dıe 
roten Streichungen wurden ım nächsten Durchlauf für j = 3 durchgeführt. Danach gab es bereits nichts mehr zu streichen. 
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4.3.5. Der Euklidische Algorithmus 


Ein Beispiel für einen recht einfachen Algorıthmus, der jedoch ın sehr 
anwendungsorientierten Zusammenhängen nützlich ıst (vgl. Abschnitt 5.4.2.), ıst der 
Fuklidische Algorithmus zur Bestimmung des größten gemeinsamen Teilers (ggT)) von zwei 
ganzen Zahlen. 


Ohne Einschränkung seien a und b zwei positive ganze, also zwei natürliche Zahlen. Dann 
lässt sıch der Euklidische Algorıthmus so beschreiben: 


WHILE a <> b DO 


BEGIN 

IFäa > b THEN 
a=a-b 

ELSE 
b=b-a 

END 

ggt = a 


Das heißt: allein durch fortgesetzte Vergleiche und Subtraktionen kann der ggT zweier 
ganzer Zahlen ermittelt werden. (Für negative ganze Zahlen ıst lediglich zuvor das 
Vorzeichen zu entfernen; auf den ggT hat dies keinen Einfluss.) 


4.4. Sortierverfahren 


In diesem Abschnitt wollen wir einige der zahlreichen Sortierverfahren behandeln, die für die 
verschiedensten Szenarien entwickelt worden sınd. Als Standardreferenz sei wıeder auf das 
klassısch zu nennende Buch von [Wirth] hingewiesen. 


Wir gehen ın unserem Rahmen davon aus, dass wir ein Array von n Elementen zu sortieren 
haben. Ohne Einschränkung und zur Vereinfachung der Darstellung gehen wir stets davon 
aus, dass es sich um ein Array mit ganzen Zahlen handelt, die aufsteigend sortiert werden 
sollen. Natürlich können ın der Praxis auch andere Datensatzstrukturen sortiert werden, ın 
diesem Falle trıtt an den hier verwendeten Vergleich zweier ganzzahliger Werte der 
Vergleich entsprechender Attrıbute bezogen auf den Ordnungen, beispielsweise 
Zeichenketten mit der lexikographischen Ordnung”. 


4.4.1. Sortieren durch direktes Einfügen 


Unser Array a (mit den Werten all], al2], ..., aln]) wird gedanklich ın zwei 
Teile zerlegt. Der Anfang all]l,...,ali] ıst die Ziel-, der zweite Teil 
ali+1],...,aln] die Quellsequenz. Wir beginnen mit i=2, betrachten alil=al2] 


und vergleichen dies mıta [1], ısta[ll]<=a[2], so belassen wır beide an ıhrem Ott; sollte 
all] > al2] seın, so setzen wır a[l2] an die Stelle von all], das alte a[1] rutscht 
nach a[2]. Anschließend wird für i=3 a[3] mit all] und a[2] verglichen und ggf. an 


’° Zwei Zeichenketten können lexikographisch verglichen werden, indem zunächst das erste Zeichen beider Zeichenketten 
(sl und s2) verglichen wırd. Kommt das erste Zeichen von sl gemäß der Codierung (z.B. ASCII) vor dem ersten Zeichen 
von s2, dann ist sl < s2. Sınd beide erste Zeichen gleich, dann wırd entsprechend mit dem zweiten Zeichen [sofern 
vorhanden] fortgefahren. Insgesamt gelangt man auf diese Weise ım wesentlichen auf die Sortierung, die man von 
Telefonbüchern oder Adressverzeichnissen kennt. 
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passender Stelle eingefügt. Dergestalt geht es weiter, bis i=n und das Verfahren zum Ende 
gekommen ist. 


An einem konkreten Beispiel mit n=6 illustriert: 


Allgemein (in Pascal) formuliert: 


FOR 14-2 TO 2n.DO 
BEGIN 
e ge al): 
alo es 
I ve 3-1; 
WHILE x < alj] DO 
BEGIN 
alj+1] := aljl]; 
j = 7-1 
END; 
2/7411] ex 
END; 


Anmerkung: die Komponente a[0] dient hier nur dem Zweck, dass die WHILE-Schleife 
kompakter formuliert werden kann. Durch dıe Bedingung x < alj] bricht diese Schleife 
nämlıch spätestens automatisch dann ab, wenn j=0 erreicht ist. 


4.4.2. Sortieren durch direktes Auswählen 


Das Gegenstück zum Einfügen ist das Sortieren durch direktes Auswählen. Hier wird jeweils 
das kleinste Element (des restlichen Arrays) bestimmt und mit dem ersten Element (des 
Restes) vertauscht. 


An einem Beispiel illustriert: 


Die fettgedruckten (und beı Farbdarstellung grün dargestellten) Zahlen sind die bereits 
sortierten Werte, wobei für ı=5 selbstverständlich auch der sechste Wert, die 34, automatisch 
bereits sortiert vorliegt. 


Die formale Beschreibung dieses Verfahrens soll den eifrigen Lesern überlassen bleiben. 


-) 
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4.4.3. Sortieren durch paarweisen Austausch (Bubblesort) 


Unter dem Namen Dubblesort ıst ein Sortierverfahren bekannt, bei dem sukzessive immer 
benachbarte Werte nötigenfalls ausgetauscht werden, - solange, bis die Sortierung vollständig 
ist. 

Der Algorıthmus, hier wieder ın Pascal dargestellt, ıst sehr einfach. 


FOR 1i:=2 to n DO 


BEGIN 
FOR j:=n DOWNTO i DO 
BEGIN 
IF alj-1] > alj] THEN 
BEGIN 
Haile s=. alje11; 
alj-1] := alj]; 
aljl z=e.h1le 
END 
END 
END 


Dieser Algorıthmus kann natürlich noch optimiert werden: beispielsweise kann man sıch 
merken, ob in einem Durchgang überhaupt noch ein Austausch erforderlich war. War dies 
nıcht der Fall, dann ıst das Array offensichtlich bereits sortiert. 


4.4.4. Quicksort 


Als Vertreter eines etwas fortgeschritteneren Verfahrens, das dann auch ın seiner 
Implementierung etwas aufwendiger ıst als die bislang vorgestellten, recht einfachen 
Algorithmen, soll hier der Ouicksort behandelt werden. 


Die Grundidee: das zu sortierende Ausgangsarray wird willkürlich ın zwei Teile geteilt, d.h. 
es wird ein Index ı bestimmt; nennen wır das zugehörige Array-Element x = alı]. Nun wird 
das Array von links kommend durchsucht bıs ein Element a[j] gefunden wird mit a[j] > x. 
Entsprechend wird das Array von rechts durchsucht bis ein Element a[k] gefunden wird mit 
alk] < x. (Sollte es beides nıcht geben, dann sınd alle Werte im Array gleich, das Array wäre 
also als Spezialfall schon sortiert; sollte es eines der beiden nıcht geben, dann wäre x das 
Minimum oder das Maxımum, das entsprechend einsortiert werden könnte; das Verfahren 
würde dann mit dem restlichen n-1 Elemente großen Array fortgeführt werden.) 


Seien | und k solche Indizes, dann werden alj] und a[k] miteinander vertauscht. Dies wırd 
fortgeführt, und so erhalten wir schließlich ein Array, ın dem lınks von x nur Werte kleiner 
als (oder gleich) x stehen, rechts von x sınd alle Werte größer oder gleich. 


Dieselbe Prozedur kann nun rekursiv auf diese beiden Teılarrays angewendet werden. 
Spielen wir dieses Verfahren exemplarisch durch. 


Wir starten mit dem folgenden Array, n=7. 


23 45 66 17 28 90 33 
Wir wählen wıllkürlich x=28, also ı=5. 


23 45.66 17 28 90 33 
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Nun wird von links kommend, also bei Index 1 startend, geprüft, ob ein Element alj] > 28 ist. 
Dies ıst für j=2 der Fall: a[2]=45 > x=28. 


Von rechts kommend ist dıe 17 das erste Element, das kleiner als x=28 ıst; der Index hıerfür 
ist k=4. 


Anschließend werden diese beiden Elemente vertauscht, j wırd auf 3 erhöht, k auf 3 
heruntergesetzt. 


23 17 66 45 28 90 33 
a[3 ]=66 > 28, k wird auf 2 heruntergesetzt. 


Damit haben wir zweı Teilarrays gefunden: das eine umfasst die beiden Elemente a[l] und 
a[2], 23 und 17, das zweite den Rest ab a[3]. Alle Elemente des ersten Teilarrays sınd kleiner 
als alle Elemente des zweiten. 


Nun kann das Verfahren für jedes der beiden Teilarrays wiederholt werden bis schließlich 
alle Stücke sortiert sınd. 


Eine Implementierung des Quicksort kann z.B. ın [Wirth] nachgeschlagen oder selbst 
programmiert werden. 
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5. KRYPTOLOGIE (KRYPTOGRAPHIE) 


5.1. Einführung 


Unter Kryptologie versteht man dıe Wissenschaft der Entwicklung von Kryptosystemen, das 
heißt Mechanismen zur Verschlüsselung von Nachrichten oder allgemeiner Daten; zu diesem 
Teilaspekt, der häufig auch Kryptographie genannt wird, kommt die sogenannte Kryp!io- 
analyse, also die Forschung nach Möglıchkeiten, ein Kryptosystem zu „knacken”. 


Für unseren Rahmen seien zunächst einmal einige Quellen für ein tiefergehendes Kennen- 
lernen kryptologischer Methoden erwähnt: einmal gibt es von Albrecht Beutelspacher ein 
kleines Büchlein ‚„Kryptologie” (siehe [Beutelspacher]), das einen sehr hübschen Einstieg ın 
die Thematik gewährt; zum zweiten findet sich im World Wide Web ein umfangreicher 
Einführungstext von Wolfgang Bachhuber auf dessen eigenem Webserver (siehe [Bachhuber] 
im Literatur- und Quellenverzeichnis). Auch die Webseiten von [Ahrweiler] liefern eine 
lesenswerte Einführung ın die Thematik. Schließlich seı auch auf das „große” Buch von 
Beutelspacher u. a. [BeuSchWol] hingewiesen, ın dem es sehr ausführlich um die ver- 
schiedenen Themen der Kryptographie geht. 


Grundsätzlich unterscheidet man Verfahrensweisen der Kryptologie nach verschiedenen 
Kriterien, vor allem dabei nach der Komplexität des Algorithmus und der Länge des 
sogenannten Schlüssels (keys). Ein sehr zentrales Merkmal ist aber auch, ob der oder die 
verwendeten Schlüssel privat oder teilweise öffentlich sind; man spricht von symmetrischen 
Kryptoverfahren, wenn mit demselben (dann natürlich nicht öffentlichen) Schlüssel codiert 
und decodiert wird. Ein Verfahren ist asymmetrisch, wenn es je einen Schlüssel für das Ver- 
und das Entschlüsseln gibt. 


Einige begriffliche Klärungen und Vereinbarungen vorweg. Wir wollen der Einfachheit 
halber als Nachrichten Texte ım Sinne von Zeichenketten betrachten. Der Ausgangstext ıst 
der sogenannte plain text (Klartext), die verschlüsselte(n) Version(en) wırd (bzw. werden) 
cipher text (Geheimtext) genannt. Wo nıchts anderes angegeben wird, wollen wır uns an eine 
von [Beutelspacher] angeregte Notation’’ halten und mit Kleinbuchstaben den Klar- und in 
Großbuchstaben den Geheimtext schreiben. 


Wiır wollen uns ım Folgenden mit Standardansätzen der Verschlüsselung beschäftigen um 
einen Einblick ın die Materie zu erhalten. Für tiefergehende Fragen werden an 
entsprechenden Stellen weiterführende Quellen genannt. 


5.2. Symmetrische Kryptosysteme (Private Key) 


Betrachten wir zunächst Verschlüsselungsverfahren, bei denen Sender und Empfänger einer 
Nachricht diese mit der Kenntnis desselben Schlüssels bearbeiten. Daher der Name 
„symmetrisch”. Naheliegenderweise darf dıesen Schlüssel keın Außenstehender erfahren. 


"" Ohne Einschränkung werden exemplarisch also nur die Kleinbuchstaben chiffriert; für die einfachen Beispiele zu Beginn 
genügt dies aber für das Verständnis vollauf. 
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5.2.1. Transpositionsalgorithmen 


Ein Transpositionsalgorithmus ıst ein Verfahren, bei dem die Zeichen innerhalb eines 
gegebenen Textes vertauscht, mathematisch formuliert: permutiert werden. 


Ein sımples Beispiel eines solchen Verfahrens ıst die Skyfale von Sparta. (vgl. 
[Beutelspacher]). Dabeı handelt es sich um einen Zylinder, auf dem Pergament spiralförmig 
aufgerollt werden kann. Je nach Radius des Zylinders (und natürlich der Schriftgröße) 
kommen andere Zeichenketten zum Vorschein. Ein Beispiel: angenommen, wır haben den 
folgenden Text linear auf ein Papıer oder Pergament geschrieben. 


whimianarfftttoissrkc 


Wickeln wir dieses Papier spiralförmig auf einen Zylinder, so dass auf den Umfang jeweils 
sechs Zeichen passen, dann entsteht folgendes Muster. 

wntr 

hatk 

Iroe 

mfi 

ifs 

ats 

Offensichtlich können wiır hier keinen sınnvollen Text erkennen. Hat unser Zylinder jedoch 
einen Umfang von vıer Zeichen, dann entsteht folgende Zeichenmatrix, der wır nun schon 
eine Information entnehmen können. 

wirtsc 

hafts 


infor 
matik 


Offensichtlich ıst dieser Algorıthmus sehr einfach, denn für das „Knacken” des Geheimtextes 
müssen wir lediglich dıe verschiedenen Varianten des „Abrollens” auf einem (gedanklichen) 
Zylinder durchspielen (oder von einem Computer durchspielen lassen). 


Dennoch sınd Transposıtionsalgorıthmen heutzutage sehr wichtige Bausteine für die 
Chiffrierung von Nachrichten. An dieser Stelle soll noch auf ein weiteres, etwas weniger 
trıviales Verfahren dieser Familie eingegangen werden. 


Hierzu nehmen wiır uns der Einfachheit halber wıeder das Wort „Wiırtschaftsinformatık” her. 
Für den Algorıthmus brauchen wır eine Schablone, z.B. dıe hier gezeigte 6 x 6-Matrix. 


Dort können wiır nun das gewünschte Wort eintragen. 
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Jetzt müssen bloß ın die restlichen Felder beliebige Buchstaben eingetragen werden, und 
schon haben wir einen codierten Text vor uns. 


Das Entziffern dieses Geheimtextes dürfte ohne die korrekte Schablone nicht ganz trıvial 
sein, ınsbesondere dann nicht, wenn ın die Leerfelder korrekte Worte oder Satzteile 
eingetragen werden und auf diese Weise auch so etwas wıe die statistische Häufigkeit 
einzelner Buchstaben realen Texten sehr nahe kommt. 


5.2.2. Substitutionsalgorithmen (u.a. DES) 


Unter einem Substitutionsalgorithmus versteht man ein Verfahren, bei dem jedes Zeichen 
durch ein anderes ersetzt wird. 


Ein sehr elementares Substitutionsverfahren ıst die Verschiebechiffre. Hıer wird jedes 
Zeichen um eine feste Anzahl ım jeweiligen Alphabet (Zeichenvorrat) verschoben. 


5.2.2.1. Ein primitives Verfahren: ROT13 


Als ROT13 hat sıch ein (prımitives) Verfahren etabliert, mıt dem man z.B. ın Newsgruppen 
das spontane Lesen oder Erkennen einer Nachricht verhindern möchte. Hierbei wird jeder 
Buchstabe um 13 Zeichen weıtergesetzt, modulo 26 natürlich. Aus A wırd somit ein N, aus 
dem X einK, aus dem P ein C. (Wir könnten jetzt weitere Beispiele’” diskutieren...) 


ORAXRAUNRYGWHAT 


Selbstverständlich ıst dieser Algorıthmus sehr leicht zu knacken. Es gıbt - im Rahmen der 26 
Buchstaben unseres Alphabetes - 26 solcher Verschiebechiffren (inklusive der vollkommen 


'® Zum Beispiel wäre zu überlegen, ob folgendes zutrifft: IVRYYRVPUGZNPUGRFVUARANHPUFCNFEF. 
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untauglichen Identität), und bezogen auf den ASCII-Code wären es auch nur 256 
verschiedene Verfahren, die leicht per trıal and error ermittelt werden könnten. 


Eines darf hier allerdings nicht außer acht gelassen gewerden: das Erraten eines solchen 
Verschiebecodes setzt voraus, dass man bewerten kann, wann die „dechiffrierten” Texte 
einen Sınn ergeben. Dies von einem Computer durchführen zu lassen würde bedeuten, dass 
dieser Zugriff auf Wörterbücher der in Frage kommende(n) Sprache(n) besitzt. 


5.2.2.2. Statistische Betrachtungen 


Eine weitere Anmerkung: gerade im Zusammenhang mit Substitutionsalgorithmen gewinnt 
dıe Statistik an Bedeutung. Gehen wir von der deutschen Sprache aus, so stellen wır fest, dass 
gewisse Buchstaben wıe etwa „e”, „n” oder „s” sehr viel häufiger vorkommen als andere. 
(Nicht nur das „q” ıst recht selten.) So hat das ‚‚e” ın etwa einen Anteil von 17,4 %, das „n” 
von knapp 10% und das „s” von über 7% (zitiert nach [Beutelspacher], vgl. auch 
nachstehende Tabelle). 


Buchstabe | Häufigkeit % 


Tabelle: Häufigkeiten der Buchstaben ın deutschen Texten (nach [Beutelspacher]) 


INNININ 


0 
Buchstabe Häufigkeit % 


9,18 
251 
0,79 
0,02 
7,00 
21 
6,15 
4,35 
0,67 
1,89 
0,03 
0,04 


N 


; 5 NN BIN i 


NN 


Beı einfachen Substitutionsalgorithmen kann somit über die Verteilungsstatistik eine 
Annahme über gewisse Zuordnungen gemacht und eventuell sogar der Code auf Anhieb 
erraten werden. 


Eine Chiffrierung muss natürlich nicht einem Buchstaben stets denselben anderen 
Buchstaben zuordnen. Tut sie es aber, so nennen wir sıe monoalphabetisch, andernfalls 
polyalphabetisch. 
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Offensichtlich gibt es gerade 26! = 2625:24:23.....2:1 - 4:10 Möglichkeiten mono- 
alphabetischer Chiffrierungen über der Menge der Kleinbuchstaben { a,b, ...,z }. 


Selbstverständlich gıbt es eine riesige Anzahl an Varıanten von Substitutionsalgorithmen. 
Durch den Einsatz von Computern müssen viele jedoch sehr schnell als ziemlich unsicher 
betrachtet werden. 


5.2.2.3. Data Encryption Standard (DES) 


Die populärste monoalphabetische Chiffrierung ist der von IBM entwickelte Data Encryption 
Standard (DES), der seit 1977 standardisiert ıst. Mit ıhm werden nicht (die 26) Buchstaben 
sondern 64-Bit-Sequenzen codiert, also Folgen von 64 Nullen und Einsen. Gemäß Standard 
werden 8 der 64 Bits für Fehlererkennung eingesetzt, so dass für den eigentlichen Schlüssel 
immerhin noch 56 Bits übrigbleiben, das heißt, dass es 2° verschiedene DES-Schlüssel gibt. 


Mit DES sınd beispielsweise die Geheimzahlen auf unseren Eurocheque-Karten 
verschlüsselt. 


Eine Variante auf DES ıst das sogenannte Triple DES, das das klassische DES-Verfahren 
einfach dreimal hintereinander anwendet: zunächst wırd der Klartext mıt einem Schlüssel A 
gemäß) DES codiert, dann mit dem Schlüssel B decodiert, dann erneut mit A codiert. 


Interessant ıst hier ein von dem Holländer Kerckhoffs bereits 1883 formuliertes Prinzip, das 
den Kern der Problematik gut umreißt”: „Die Sicherheit eines Kryptosystems darf nicht von 
der Geheimhaltung des Algorithmus abhängen. Die Sicherheit gründet sich nur auf die 


Geheimhaltung des Schlüssels. 


5.2.3. Polyalphabetische Chiffrierungen 


Monoalphabetische Chiffrierungen haben den Nachteil, dass sie die statistische Analyse eines 
Geheimtextes begünstigen, denn korrespondierend zu den Häufigkeitsverteilungen der 
einzelnen Buchstaben ın der jeweiligen Sprache treten ın den Geheimtexten diese 
Häufigkeiten wıeder auf: nur vertauscht bei dem jeweiligen Ersatzzeichen des Codes. 


Beı polyalphabetischen Chiffrierungen wird ein Zeichen nicht immer mit demselben anderen 
Zeichen codiert. Daher ıst die Analyse der Häufigkeitsverteilungen (von einzelnen Zeichen) 
nıcht mehr erfolgreich. 


Beispielsweise kann über folgende mengenmäßige Zuordnung von zweistelligen Zahlen zu 
Buchstaben dafür gesorgt werden, dass zum einen leicht codiert und decodiert werden kann, 
dass zum anderen aber dıe Häufigkeiten der zweistelligen Zahlen (annähernd) gleichverteilt 
sind. Dazu werden zu jedem Buchstaben seiner statistischen Häufigkeit entsprechend viele 
Zahlenpaare angeboten. Nachstehend ein Auszug einer solchen Zuordnung. 


A 09 18 22 52 58 63 89 

B 14 82 

C 01 08 41 

D 07 17 71 72 83 

E 03 12 43 46 51 54 61 65 68 7/3 7/7 79 80 83 87 90 93 


® Zuitiert nach [Beutelspacher], S. 23. 
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F 00 13 
G 04 27 88 
H 11 45 53 6/ 78 


Y 44 
Z 16 


Damit kann dann ein Text sehr einfach codiert werden: für jeden Buchstaben des 
Klarschrifttextes wırd zufällig eine der zugeordneten Zahlen ausgewählt. Aus BACH wird 
auf diese Weise 14580145. Oder auch 82090167. Und decodiert werden kann er ebenso 
einfach. (Tun Sıe’s doch einmal für 44792245...) 


Dadurch, dass dıe Häufigkeiten der einzelnen (Geheim-)Zeichen einigermaßen gleichverteilt 
sind, ıst ein solcher Geheimtext aber natürlich noch lange nıcht sicher. So können zum Bei- 
spiel aus der Häufigkeitsverteilung von Zwei-Zeichen-Gruppen ebenfalls Schlussfolgerungen 
gezogen werden. 


Der französısche Diplomat Vigenere führte 1586 dıe nach ıhm benannte Verschlüsselung eın, 
bei der verschiedene monoalphabetische Chiffrierungen im Wechsel eingesetzt werden. 
Hierfür benötigen wır das sogenannte Vigenere-Quadrat und eın Schlüsselwort. 


abcdefghijkImnopqrstuvwxyz Klartext 
ABCDEFGHIJKLMNOPQRSTUVWXYZ Das Vigenere-Quadrat 
BCDEFGHIJKLMNOPQRSTUVWXYZA 
CDEFGHIJKLMNOPQRSTUVWXYZAB 
DEFGHIJKLMNOPQRSTUVWXYZABC 
EFGHIJKLMNOPQRSTUVWXYZABCD 
FGHIJKLMNOPQRSTUVWXYZABCDE 
GHIJKLMNOPQRSTUVWXYZABCDEF 
HIJKLMNOPQRSTUVWXYZABCDEFG 
IJKLMNOPQRSTUVWXYZABCDEFGH 
JKLMNOPQRSTUVWXYZABCDEFGHI 
KLMNOPQRSTUVWXYZABCDEFGHI) 
LMNOPQRSTUVWXYZABCDEFGHIJK 
MNOPQRSTUVWXYZABCDEFGHIJKL 
NOPQRSTUVWXYZABCDEFGHIJKLM 
OPQRSTUVWXYZABCDEFGHIJKLMN 
PQRSTUVWXYZABCDEFGHIJKLMNO 
QRSTUVWXYZABCDEFGHIJKLMNOP 
RSTUVWXYZABCDEFGHIJKLMNOPQ 
STUVWXYZABCDEFGHIJKLMNOPQR 
TUVWXYZABCDEFGHIJKLMNOPQORS 
UVWXYZABCDEFGHIJKLMNOPQORST 
VWXYZABCDEFGHIJKLMNOPQORSTU 
WXYZABCDEFGHIJKLMNOPQRSTUV 
XYZABCDEFGHIJKLMNOPQRSTUVW 
YZABCDEFGHIJKLMNOPQORSTUVWX 
ZABCDEFGHIJKLMNOPQRSTUVWXY 


Dieses Quadrat besteht also aus 26 untereinander geschriebenen Alphabeten, dıe jeweils um 
ein Zeichen weiter versetzt sind. 


Wählen wir als Schlüsselwort KAUKASUS, so können wır einen Klartext wıe folgt 
verschlüsseln. Wir schreiben Schlüsselwort und Klartext übereinander. 


- 102 - 


Schlüsselwort: KA UK AS US KA UK 
Klartext: st ren e 1 


Der Buchstabe des Schlüsselwortes über einem Zeichen des Klartextes legt die Zeile aus dem 
Vigenere-Quadrat fest, mıt dem zu chiffrieren ist. 


Über dem „s” steht das „K”, also wird mit dem Alphabet in der „Zeile K” chiffriert: zu dem 
Buchstaben „s” gehört dort „C”. Uber dem „t” steht das „A”, also finden wir im Quadrat in 
der „Zeile A” zu „t” den Codebuchstaben ‚„T”. Und so fahren wir fort und erhalten den 
Geheimtext „CTLONYAWRECW”. 


Es muss jedoch angemerkt werden, dass auch dergestalt verschlüsselte Texte nıcht unbedingt 
sicher sınd. 1863 wurde von Friedrich Wilhelm Kasıski ein einfacher Test auf dıe Schlüssel- 
länge publiziert, der jedoch auf eine Idee von Charles Babbage zurückgeht. 


Die Idee: treten im Klartext ıdentische Buchstabenfolgen auf, z.B. häufige Worte wie “ein” 
oder “dıe”, dann entsprechen diesen ı.a. unterschiedliche Cipher Text Zeichenfolgen; sind 
diese identischen Klartextzeichenfolgen jedoch um ein Vielfaches der Schlüssellänge 
voneinander entfernt, so sind dıe zugehörigen verschlüsselten Zeichenfolgen identisch! 


Der Kasiski-Test: liegt ein ım Vergleich zum verwendeten Schlüssel langer Cipher Text vor, 
so kann ın letzterem nach Wiederholungen von Buchstabengruppen (-mindestens Paaren-) 
gesucht werden; die Differenz dieser Wiederholungen ıst ein mögliches Vielfaches der 
Schlüssellänge. 


Betrachten wır das nachstehende Beispiel. 


Schlüssel: FHDW 
Text: nachmittagsfindetdieveranstaltungimaltbaustatt 
Codiert: SHFDRPWPFNVBNUGAYKLAALUWSZWWOAXULPPWOAEWZZWWYA 

BED EN REN A RE lerne]: 
Wiederholung gefunden bei i= 5 und j=34 [PW] Indexdifferenz: 29 
Wiederholung gefunden bei i=25 und j=41 [ZW] Indexdifferenz: 16 
wiederholung gefunden bei i=26 und j=42 [WW] Indexdifferenz: 16 
wiederholung gefunden bei i=27 und j=35 [WO] Indexdifferenz: 8 
Wiederholung gefunden bei i=28 und j=36 [QA] Indexdifferenz: 8 


. 
ITALIEN 
. 


Die Schlüssellänge ıst 4, dıe festgestellten Wiederholungen (von Paaren) ergeben dıe Werte 
29, 16 und 8. Die 29 ıst eın typıscher “Fehlfund”, dıe 8 und dıe 16 dagegen deuten jedoch auf 
eine Schlüssellänge, dıe ın 8 und 16 als Teiler vorkommt, also 8, 4 oder 2. 


Beı genauerem Hinsehen stellt man fest, dass die Sequenzen ZWW und WOQA sogar 
Dreierketten sınd, und dıese wıederholen sıch beı einer Differenz von 8 bzw. 16. 


Nun kann also mıt den Schlüssellängen 2, 4 und 8 probiert werden, den Cıpher Text zu 
knacken. Dabei ıst allerdings noch einmal zu betonen, dass diese “Erkenntnis” nur eine 
Vermutung darstellt, oftmals wırd man auch durch zufällige Wiederholungssequenzen auf 
fehlerhafte Kandidaten für die Schlüssellängen stoßen. 


Zur Ergänzung des Kasıski-Testes bietet sich eın auf den ersten Blick komplizierter 
wiırkendes Verfahren, der Friedman- oder Kappa-Test an. Dieser Algorıthmus wurde 1952 
von William Friedman entwickelt. Ausgangsfrage hierbei: “Mit welcher Wahrscheinlichkeit 
besteht ein willkürlich herausgegriffenes Buchstabenpaar aus zwei gleichen Buchstaben?”. 
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Betrachten wır eine Zeichenkette der Länge n. Seien n., n, usw. die Anzahl der Buchstaben a, 
b usw. ın dem Text. Nun interessieren wir uns für die Anzahl der Paare mit zwei gleichen 
Buchstaben, wobei diese nicht direkt hintereinander stehen müssen. Das erste a 
beispielsweise kann eines von n. vielen sein; für das zweite a bleiben dann n.-1 Stück zur 


Na(na-1) 


Auswahl. Die Reihenfolge spielt hierbei keine Rolle, so dass es —7— Möglichkeiten gibt. 


Somit ıst die Anzahl der Paare, bei denen beide Buchstaben gleich sind: 


Na(Na-1) np(ns-1) = Na(na-1) 


a aus a..Zz 2 


Die Wahrscheinlichkeit, ein Paar aus zweı gleichen Buchstaben zu “ziehen”, ergibt sıch 
somit zu” 
na(na-]) 
Jan, aausa.z 
K= nn-1) 
2 


Diese Zahl heißt der Friedmansche Koinzidenzindex x (lies: “kappa”). 


Kennen wiır die Verteilung der einzelnen Buchstaben (z.B. innerhalb der deutschen Sprache), 
und seien dies die Wahrscheinlichkeiten bzw. relativen Häufigkeiten »,, ..., p: für die 
Buchstaben a, ... , z, dann ergibt sıch als Wahrscheinlichkeit dafür, eın Paar aus zwei gleichen 
Buchstaben zu ziehen, der (gerundete®') Wert 2 _p?2. 


a aus d..Z 


Für einen Text der deutschen Sprache ergibt sıch (vgl. hierzu dıe Tabelle auf S. 99) dieser 
Wert zu 0,0762. Wären die Buchstaben dagegen völlig gleichverteilt, d.h. wäre 
Pa = Pop = ... = Pz = 1/26, so ergäbe sich der Wert, 2 „Pi = 0,0385. (Dies ıst übrıgens der 
kleinste Wert, den dieser Ausdruck unter der Nebenbedingung __%&, -Pa = | annehmen 
kann’”.) 


Wurde eın Klartext mit einem monoalphabetischen Verfahren verschlüsselt, so wırd auch der 
Cipher Text denselben Koinzidenzindex wıe der Klartext aufweisen, d.h. näherungsweise 
wiederum 0,0762 ım Falle eines “typischen” deutschsprachigen Textes. Ist dagegen der 
Koinzidendindex eines Cipher Textes deutlich kleiner als dieser Wert, dann wird er 
vermutlich nıcht monoalphabetisch verschlüsselt worden seın. 


5.2.4. One Time Pad 


1917 wurde von Gilbert Vernam das Verfahren one time pad vorgestellt. Hierbei wird - 
analog zum Vigenere-Mechanismus - mit sehr vielen Schlüsseln gleichzeitig chiffriert. 
Gehen wır von einer Klartextlänge n aus, dann wird auch ein Schlüssel der Länge n zufällig 
aus der Menge aller möglichen Schlüssel gewählt. Betrachten wır die 26 üblichen 
Buchstaben, dann gıbt es 26” verschiedene Schlüsselfolgen. Jedes Zeichen des Klartextes 
wırd nun mit dem betreffenden Schlüsselzeichen codiert. 


Betrachten wir das Verfahren auf einzelnen Bits und legen die Modulo-2-Addition” 
zugrunde, dann kann die Chiffrierung schematisch wie folgt dargestellt werden. 


00 
oO 


Dies ıst die Anzahl der gewünschten Möglichkeiten dıvidiert durch die Anzahl aller Möglichkeiten. 


[020] 
_ 


Streng formal wird hıer zugelassen, dass zweimal dieselbe Position aus dem Text ausgewählt wird. Für große n ıst dies 
aber vernachlässigbar. 


00 
[557 


Mathematisch ambitionierte Leser dürfen diese Aussage geme formal beweisen. 
Das bedeutet: 0+0=0, 0+1=1+0=1, 1+1=0. Technischer orientiert kann dies auch als „XOR” gelesen werden. 


00 
ww 
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Schlüssel: 011000100 1 1 10 
Klartext: ı101 1 1 100710 1 0 
Geheimtext: ı0 11110009001 00 


Betrachtet man die „statistische Sicherheit” dieses Verfahrens, dann stellt man fest: alle 
(0,1)-Folgen der Länge n sınd gleich wahrscheinlich. In diesem Sınne hält ein derart codierter 
Geheimtext den zuvor diskutierten statistischen Analyseversuchen stand’°*. 


Aber es gibt - natürlıch - einen gravierenden Nachteil: da der jeweilige Schlüssel nıcht gut 
zusammen mit der Nachricht verschickt werden kann, muss er entweder zeitlich vorher 
und/oder auf einem anderen (sicheren!) Kommunikationsweg vom Sender zum Empfänger 
gelangen oder gelangt sein. Das ıst zwar realisierbar, kommt aber für bei weitem nicht alle 
praktischen Anwendungsfelder ın Frage. Insbesondere kann ein solches Verfahren nicht oder 
nur sehr bedingt ım Kontext von Electronic Commerce und Internet eingesetzt werden, da 
sich dıe möglichen Kommunikationspartner vor dem Handelsgeschäft nıcht (unbedingt) 
kennen, also auch nıcht vorher einen Schlüssel ausgetauscht haben (können). 


5.2.5. Schieberegister 


Beim interessanten Ansatz des One Tıme Pads haben wir gesehen, dass ein Problem ın der 
(sicheren) Übermittelung des (langen) Schlüssel(texte)s besteht. Ein wichtiger Ansatz, dieses 
Problem zu lösen, besteht in der Verwendung pseudozufälliger Zeichen- oder Bitfolgen. 
Darunter versteht man eine Folge, dıe nicht wirklich zufällig ıst, sich faktisch durch die 
Kenntnis weniger Daten rekonstruieren lässt, die sich aber ın Hinsicht auf zahlreiche 
Prüfverfahren wıe eine zufällige Folge verhält. 


5.2.5.1. Lineare Schieberegister 


Es gibt zahlreiche Möglichkeiten, Pseudozufallsfolgen zu generieren; ın der Praxis haben 
sich sogenannte Schieberegister durchgesetzt, weıl diese auch hardwaremäßig gut realisiert 
werden können und die zugehörige mathematische Theorie sehr weit fortgeschritten ıst. 


a u BE 5 BEE u BE u 


Ein Schieberegister (im obigen Bild ıst eines der Länge 4 dargestellt) ıst eine endliche Folge 
von Zellen, die zu einem Zeitpunkt jeweils ein Bit, also O0 oder 1, aufnehmen können. Mit 
einer bestimmten Taktung werden die Bits “durchgeschoben”, am Ausgang des Schiebe- 
registers entsteht auf diese Weise eine Ausgabe-Folge. 


Hierbei ıst noch zu klären, nach welcher Gesetzmäßigkeit am Anfang des Schieberegisters 
welche Bits nachgeliefert werden. 


% [Beutelspacher] legt ın seinem Buch dar, dass das One Time Pad eın „perfektes” Chiffrierungssystem ist. 
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Beispiel: Sei S ein solches Schieberegister mit dem Startzustand (1,0,1,1); dann ıst nach 
einem Takt dıe Belegung des Registers (-,1,0,1), als Output wurde die 1 generiert. Im 
nächsten Takt folgt eine weitere 1, das Register besitzt die Belegung (-,-,1,0). [Die Striche 
“_” deuten an, dass wir noch keinen Mechanısmus formuliert haben, wıe “von links” die 
Anfangszellen neue Werte erhalten sollen. 


Erster Ansatz: wır können postulieren, dass das Schieberegister den letzten Wert nıcht nur 
nach außen abgibt, sondern diesen auch in die erste Zelle wieder einspeist. 


Mit der Anfangsbelegung S(0) = (1,0,1,1) ergeben sich dann die Folgebelegungen 
S(1) = (1,1,0,1), S(2) = (1,1,1,0), SG) = (0,1,1,1), S(4) = (1,0,1,1). Offensichtlich ıst dieser 
Mechanismus nicht besonders spannend, denn nach vier Takten stellt sich wiederum die 
Anfangsbelegung ein, womit auch die Output-Folgen eine Periode von (nur) vier aufweisen. 
Die früheren Betrachtungen machen klar, dass dies eine gar zu trıviale Gesetzmäßigkeit für 
einen möglichen Schlüssel darstellt! 


Der Ansatz der Rückkopplung an sıch ıst indes ın Ordnung, lediglich der Algorıthmus darf 
nicht so elementar sein wie im eben vorgestellten Beispiel. 


+ 


Die hier gezeigte Skizze soll bedeuten, dass bei jedem Takt die dritte und die vierte Zelle ıhre 
Werte ım Sınne der Modulo-2-Addition an dıe Zelle 1 rückkoppeln. 


Damit gılt für dıe Anfangsbelegung S(0) = (1,0,1,1): SC) = (0,1,0,1), SQ) = (1,0,1,0), 
S(3) = (1,1,0,1), S(4) = (1,1,1,0), S65) = (1,1,1,1), S(6) = (0,1,1,1), S(7) = (0,0,1,1), 
S(8) = (0,0,0,1), S(9) = (1,0,0,0), S(10) = (0,1,0,0), Sl) = (0,0,1,0), SC2) = (1,0,0,1), 
S(13) = (1,1,0,0), SC14) = (0,1,1,0), SC15) = (1,0,1,1) = S(0). Die Periode ıst somit 15. Der 
hierbei erzeugte Output ist 110101111000100 [von links nach rechts chronologisch 
angeordnet]. 


Dieses Beispiel illustriert, dass lineare Schieberegister konstruiert werden können, mit denen 
man auf recht einfache Weise Pseudozufallszahlenfolgen’’ generieren kann. Weitergehende 
Betrachtungen zeigen allerdings, dass die Kryptoanalyse linearer Schieberegister nicht 
besonders schwierig ıst, so kann gezeigt werden, dass ein lineares Schieberegister der Länge 


®° An dieser Stelle gehen wir nıcht auf die für Pseudozufallszahlen geforderten mathematischen Rahmenbedingungen ein. 
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n bereits aus 2n Paaren aufeinanderfolgender Klartext-/Geheimtextbits rekonstruiert werden 
kann! 


5.2.5.2. Nichtlineare Schieberegister 


Um dieser Schwachstelle zu begegnen, erweitert man das Konzept der Schieberegister und 
wird “nichtlinear”. Das heißt: als Rückkopplungsfunktionen werden nıcht mehr nur lineare 
Summenterme verwendet, alle Zellen können auch über andere Funktionsvorschriften auf die 
Neubelegung der ersten Zelle einwirken. 


Hierzu ein konkretes Beispiel. 


(b1 +1)*b2+b4 +1 


Im obigen Bild ıst ein solches nıchtlineares Schieberegister dargestellt. Die Zellen I, 2 und 4 
tragen mit ıhrer aktuellen Belegung zur Neuberechnung über dıe genannte Formel beı zur 
Neubelegung der Zelle 1 ım nächsten Takt. 


Hat dieses Schiebregister die Anfangsbelegung S(0) = (0,1,0,1), so ist SC1) = (1,0,1,0), denn 
b1-neu berechnet sich gemäß der Formel”° b1-neu = (bl+1)*b2 +b4 + 1= (O+H1)*I +1+1>= 
1. 


Dass dieses Schieberegister nicht “versehentlich” wieder linear ist, sieht man daran, dass die 
Anfangsbelegung (0,0,0,0) nıcht auf sich selbst abgebildet wird, d.h. auch wenn mit dem 
Nullzustand begonnen wird, nimmt das Schieberegister in den folgenden Takten nichttriviale 
Belegungen an. 


5.3. Integrität und Authentikation 


Ging es bislang um die Betrachtung passıver Angrıffe auf Informationen (Nachrichten), d.h. 
das Bemühen, Texte zu entschlüsseln, Codes zu knacken, so soll es nun um aktıve Angriffe 
gehen: damit bezeichnen wır das aktive Eingreifen ın den Nachrichtenaustausch selbst. 


Drei Arten solcher aktıven Angriffe werden üblicherweise unterschieden. Einmal ıst zu 
klären, ob eine empfangene Nachricht unverändert geblieben ıst; hier spricht man von 
Nachrichtenintegrität. Die zweite Fragestellung: stammt dıe Nachricht auch wirklich vom 
angegebenen Sender? Dies betrifft dıe Nachrichtenauthentikation. Und schließlich 
bezeichnet Denutzerauthentikation das Problem, ob eine Person ıhre Identität “beweisen” 
kann. 


®° Natürlich wird hierbei jeweils modulo 2 gerechnet. 
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5.3.1. Message Authentication Code (MAC) 


Zunächst soll es um Nachrichtenintegrität und -authentikation gehen. Hierzu benötigt der 
Empfänger neben der Nachricht m selbst zusätzliche Information zur Prüfung. Eine solche 
Information(smenge) wollen wir Message Authentication Code, MAC, nennen. 


Skizzenhaft dargestellt: Wird die Nachricht m (“message”) übertragen, so wırd mit einem 
Algorıthmus A, der von einem Schlüssel k (“key”) abhängt, dieser MAC generiert, kurz mit 
MAC := A(k,m) notiert?”. 


Mit der Nachricht m wird vom Sender auch der ermittelte MAC mitgeschickt; der 
Empfänger, der ebenfalls den Schlüssel k kennen muss, prüft dann, ob MAC = Ack,m) gilt. 
Hat ein aktıver Ein- und Angreifer die Nachricht m geändert (und evtl. auch den MAC-Wert), 
so erhält der Empfänger die (geänderte) Nachricht m’ zusammen mit dem (hoffentlich 
ungültigen!) MAC’. Sofern der Algorıthmus A “gut” und der Schlüssel k geheim (geblieben) 
ist, wird MAC’ nicht mit A(k,m’) übereinstimmen. Somit erhält der Empfänger das Signal: 
diese Nachricht ist nicht ım Originalzustand - bzw. stammt nicht vom angegebenen 
Absender. 


Selbstverständlich kann der Empfänger dıe Orıginalnachricht m nıcht wiederherstellen; ggf. 
muss der Absender dıe Nachricht m erneut senden. 


Zur Berechnung eines solchen MACs werden häufig Cipher Block Chaining Mechanısmen 
eingesetzt: Hierbei wırd eine Blockgröße n, z.B. 64 Bit, festgelegt. Die Nachricht m (-hier 
wıeder aufgefasst als O-1-Folge-) wırd zerlegt ın n-Bit-Pakete mı, m,, ... . Dann wird mit 
einer Verschlüsselungsfunktion f der erste Block codiert zu cı := f(mı). cı ıst also der erste 
Cipher Text Block. Bevor jetzt m» codiert wird, wird dieser Block cı bitweise zu m» addiert, 
dann erst wırd c> := f(cıtm;) berechnet. Dies wırd wıederholt, bıs alle Blöcke sukzessive 
codiert worden sınd. 


f f E 
Ua. =: "Zi 2 ar 72 


Damit dieser Algorıthmus geeignet ıst, müssen zwei Forderungen erfüllt sein. 


Erstens muss es “praktisch unmöglich” sein”, zu einem gegebenen MAC-Wert eine passende 
Nachricht m zu finden. Gilt diese Eigenschaft, so spricht man von einer 
Ekinweg-Hashfunktion. 


Ebenso sollte es “praktisch unmöglich” sein, zwei verschiedene Nachrichten zu finden, die 
denselben MAC-Wert besitzen. Ist dies erfüllt, so spricht man von einer kollisionsfreien 
Hashfunktion. 


Der ın Abschnitt 5.2.2.3. kurz vorgestellte DES-Algorithmus (sh. Seite 100) ıst ein Beispiel 
für eine solche Hashfunktion und wırd oft für MAC-Berechnungen herangezogen. 


[0,0] 
I 


Ob hierbei dıe betreffende Nachricht m verschlüsselt ist oder nıcht, das spielt hier keine Rolle; an dieser Stelle geht es 
nicht um Geheimhaltung, sondern um Sicherung der Nachricht. 


{ee} 
00 


Mit “praktisch unmöglich” ıst gemeint, dass die entsprechende Berechnung “viel zu lange” dauern würde, z.B. mehrere 
Jahrhunderte. In der Praxis kommt hinzu, dass eine entsprechende Attacke ın sehr begrenzter Zeit stattfindet, so dass 
auch ein Zeitraum von mehreren Wochen oder Monaten meistens ausreichend Schutz bietet. 
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5.3.2. Benutzerauthentikation 


Ebenso bedeutsam wie die Integrität und Authentizität von Nachrichten sicherzustellen ist die 
zweifelsfreie Identifikation von Personen (Benutzern). Grundsätzlich lässt sich ein Mensch 
erkennen durch a) bestimmte, charakteristische Eigenschaften, b) durch Besitz (z.B. von 
Ausweisen) sowie c) durch Wissen”. 


Der erstere Typus (“durch Eigenschaften”) spielt zwischenmenschlich eine sehr bedeutende 
Rolle, wırd zur Zeit ın Zusammenhang mit technischen Lösungen jedoch auf wenige 
Merkmale reduziert”. 


Dagegen sınd “Wissen” und “Besitz” häufig eingesetzte Verfahren. 


Zur Gruppe “Wissen” gehören beispielsweise alle Varianten von Passwörtern. Diese können, 
sehr einfach, als Klartexte abgespeichert sein, und werden mit einer Benutzereingabe 
verglichen. Passwörter können aber ebenfalls, wie zuvor beschrieben, über 
Einweg-Hashfunktionen verschlüsselt worden sein, so dass die Benutzereingabe (im 
Klartext) entsprechend verschlüsselt und dann mit dem abgelegten Vergleichsmuster 
abgeglichen wird. 


Am Rande seı bemerkt, dass ın der Praxis Passwortverfahren vor allem an den menschlichen 
Schwächen der menschlichen Benutzer kranken. Entweder suchen sıch dıe Benutzer 
einfachste Passwörter aus, die sıe sıch gut merken können (“Eva”, “Köln”, 
“Mecklenburg-Vorpommern” oder “FHDW”), oder komplizierte Passwörter werden auf 
Zettelchen geschrieben und auf den Monitor geklebt, womit zumindest gewisse 
Benutzergruppen einfaches Spiel haben. 


Unter dem Strich genügt aber kein Passwortsystem gehobenen Sıcherheitsansprüchen, denn 
selbst wenn die Systemverwaltung dıe Benutzer zwingt, ın festen Zeitabständen ıhr Passwort 
zu ändern, so werden dennoch dieselben Passwörter für mehrere Logins verwendet. Und ein 
solcher Login kann von einem Angreifer abgehört werden, womit sıch dieser anschließend 
zumindest ın der Frist bis zur nächsten Passwortänderung unter der fremden 
Benutzerkennung anmelden könnte”. 


Damit dieses Problem gelöst werden kann, müssen sich die Daten, die zwischen Benutzer 
und Rechner ausgetauscht werden, jedesmal ändern. Und natürlıch darf nur der berechtigte 
Benutzer die korrekte Antwort geben können. 


Ein solcher Mechanısmus wird Challenge and Response genannt: der Rechner und der 
Benutzer verfügen über eine Einweg-Hashfunktion f und einen gemeinsamen, geheimen 
Schlüssel”° k. Der Rechner erhält die Benutzerdaten (beispielsweise die Benutzerkennung 


Auf der Identifikation durch Wissen beruhen dıe sog. Geheimfragen, dıe z.B. Mail-Anbieter neben einer gewöhnlichen 
Passwortabfrage verwenden. “Wie lautet der Geburtsname der Mutter?” - Das ıst eine Frage, dıe nıcht nur davon ausgeht, 
dass dıe Mutter verheiratet ıst und hierbei auch einen anderen Namen angenommen hat, sie geht vielmehr auch davon 
aus, dass dieser Name keinem Dritten bekannt ıst. Was nıcht zwingend zutreffen muss... 

Beispiele hıerfür sınd Fingerabdruckskontrollen oder andere biometrische Verfahren wıe die Gesichtsanalyse. 


\D 
- 


Eın noch besserer Sıcherheitsstandard wird erreicht, wenn Eınmal-Passwörter verwendet werden, also Passwörter, dıe 
jeweils nur einmal gültıg sind und dann verfallen. Naturgemäß steigt auch der Verwaltungsaufwand hierbei. Dieses 
Prinzip wird beim Online-Banking mit der Verwendung von Transaktionsnummem (TAN) realisiert. 


\O 
[357 


Selbstverständlich, wıe nachfolgend auch weıter beschrieben wird, gıbt es für jeden Benutzer einen eigenen 
Schlüsselwert k. 
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“user43”) und ermittelt damit (etwa aus einer Systemtabelle oder aus einem anderen, 
globalen Schlüssel errechnet) den Benutzerschlüssel k. Für dıe folgende Diskussion seı k der 
korrekte, beim Rechner verwaltete Schlüssel, k’ seı der Wert, den der Benutzer (oder der 
Angreifer) verwendet. Korrekt ıst das Ganze, wenn k = k’ ist. 


Beim Anmeldevorgang sendet der Rechner dem Benutzer (als “Challenge”) eine 
(ganzzahlige Pseudo-)Zufallszahl x. Dieser antwortet, indem er (mit dem Schlüssel k’) die 
Antwort (“Response”) f(k’,x) berechnet und an den Rechner sendet. Der Rechner ermittelt 
parallel dazu mit dem Schlüssel k den Wert f(k,x) und vergleicht anschließend, ob f(k,x) = 
f(k’,x) gilt. In diesem Falle scheint alles korrekt zu sein, und der Rechner gewährt dem 
Benutzer den erwünschten Zugang. 


Der große Vorteil eines solchen Verfahrens ist, dass tatsächlich eın konkretes “Passwort” auf 
diese Weise nur einmal über die Leitung gesendet wird, ein Abhören der Leitung führt also 
nicht zu einem direkt verwertbaren Zugang”. 


Allerdings muss registriert werden, dass Berechnungen mittels Einweg-Hashfunktionen nicht 
gut ım Kopf stattfinden können, so dass auch auf Benutzerseite ein Computer beteiligt 
werden sollte, - und eın solcher Computer (genauer: Chip) findet sich auf modernen 
Chipkarten: dıe Berechnung der hier benötigten Zahlenwerte findet auf der Chipkarte statt. 


Damit “vererbt” sıch eine Problematik: woher “weiss” dıe Chipkarte, dass ıhr rechtmäßliger 
Besitzer sıe verwendet? - Auch hier muss dann wieder eine Authentifizierung erfolgen, z.B. 
mittels einer Geheimnummer (wie bei Bank- oder Kreditkarten). 


5.3.3. Zero Knowledge Protokolle 


Abschließend wollen wir eine besonders eigenwillige Fragestellung behandeln. Es geht um 
dıe Frage, ob eine Person A eine zweite Person B davon überzeugen kann, dass sıe ein 
bestimmtes Geheimnis besitzt, ohne jedoch über dieses Geheimnis etwas zu verraten. Eın 
solches Verfahren (“Protokoll”) wird suggestiv Zero Knowledge Protokoll genannt. 


Ein historisches Beispiel”: Der Mathematiker Niccolö Tartaglia entdeckte 1535 die Methode 
zur allgemeinen Lösung der kubischen Gleichung ax’+bx’+cx+d = 0. Die Lösung wollte er 
jedoch nıemandem verraten. - Um Dritte zu überzeugen, dass er die Lösung jedoch kannte, 
konnte er anbıeten, dass ıhm Werte für a, b, c und d - also konkrete kubische Gleichungen - 
vorgelegt wurden. Wenn er immer (und zügig) die korrekten Lösungen angeben konnte”, 
dann war es praktisch bewiesen, dass er die Formel besitzen musste”. 


Fs seı nur am Rande erwähnt, dass natürlich beı entsprechender “Hoheit” über das Netzwerk ein Eindringling die 
Kommunikation zwischen Sender und Empfänger unterbrechen könnte; ın diesem Falle könnte der Angreifer dem Sender 
(Benutzer) eine Fehlermeldung senden (“Rechner meldet Fehler!”) und selbst dıe Verbindung mit dem Rechner 
fortführen! 

Wıe manches andere Zitat ist auch dieses Beispiel dem Buch von [Beutelspacher] entnommen. 

Selbstverständlich ıst es elementar nachzuprüfen, ob drei konkrete Werte eine bestimmte kubische Gleichung lösen, 
wohingegen das Finden dieser Lösungen für beliebig viele kubische Gleichungen ohne Kenntnis der Formel von 
Tartaglıa praktisch unmöglich ıst. 

Die Formel zur Lösung kubischer Gleichungen heißt Cardanosche Formel, - benannt nach Geronimo Cardano, der 
Tartaglıa dıe Formel “abluxte’” und sıe dann auch veröffentlichte. 
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1986 stellten die israelischen Wissenschaftler Fiat und Shamir ein 
(Zero-Knowledge-)Protokoll vor, das überraschenderweise Fiat-Shamir-Protokoll genannt 
wird. Dieses Protokoll beruht auf der Tatsache, dass es extrem schwierig ıst, Quadratwurzeln 
modulo n einer Zahl v zu finden. Das heißt: Es seı n eine (in der Praxis “große”) natürliche 
Zahl, die keine Primzahl ıst. Ist die Primfaktorzerlegung von n unbekannt, dann ıst es ın 
begrenzter Zeit nahezu unmöglich, eine Zahl s zu finden, für die v = s’ mod n gilt. (s heißt 
dann eine Quadratwurzel von v modulo n.) 


Beispiel: Nehmen wır (zur Demonstration) eine “kleine” Zahl n; es seı n = 35. Dann ist hier 
dıe Primfaktorzerlegung natürlich bekannt, die Faktoren sind 5 und 7. Suchen wir zuv=11 
dıe bzw. eine Quadratwurzel modulo n, so kommen wır nach wenigen Versuchen (?) auf die 
Zahl s = 19, denn 19*19 = 361 = (350+11) = 11 mod 35. 


Für dıe Authentifizierung eines Benutzers (einem Computer gegenüber) wird dieser 
Mechanismus wie folgt eingesetzt. Da das Hantieren mit sehr großen Zahlen “unmenschlich” 
ist, wırd ein Chip (auf einer Chipkarte) eingesetzt. Der Benutzer erhält (von einer zentralen 
Instanz, dıe z.B. die Chipkarte ausgibt) eine Zahl s, dıe das “Geheimnis” des Benutzers 
verkörpert. Als öffentlich bekannte Zahl n wird ein Produkt aus zwei “großen” Primzahlen p 
und q genommen, wobeı p und q nıcht öffentlich bekannt sınd und dıe Faktorisierung von n, 
also dıe Aufspaltung ın die Primfaktoren p und q, als “praktisch unlösbar” gilt. Ebenso wird 


(5.3.3.1)v=s’modn 
berechnet; v ıst dıe öffentliche Identifizierung für den betreffenden Benutzer. 


Nochmals im Überblick: p und q sind (geheimgehaltene) “große” Primzahlen, n ist das 
Produkt dieser beiden und öffentlich bekannt. s ıst eine zu n teilerfremde Zahl, dıe nur dem 
Benutzer bekannt ıst. v wiederum ist öffentlich bekannt. 


Der Mechanismus des Fıat-Shamir-Protokolls funktioniert nun wiıe folgt. Der Benutzer wählt 
zufällig eine Zahl r, die teilerfremd zu n ıst, und berechnet 


(5.3.3.2)x=r”modn. 


Diese Zahl x wird an den Rechner geschickt, der sich von der Identität des Benutzers 
überzeugen muss. 


Der Rechner wählt zufällig ein Bit b, also O0 oder 1. Ist dieses 0, so soll der Benutzer 
y :=r mod n berechnen, ıst das Bit 1, so soll y := rs mod n bestimmt werden. Dieser Wert y 
wird anschließend dem Rechner zurückgeschickt. 


Dieser kann nun überprüfen, dass im Falle b=0 die Beziehung y’ mod n =x gilt, und dass im 
Falle b=1 die Gleichung y’modn=xv mod .n ist. 


Begründung: 1.Fall, b=0: y=rmodn; nach (5.3.3.2) ist y’modn=r"modn=x. 
2.Fall, b=1: Hier ist y :=rs mod n. Damit ergibt sich: y° mod n = (rs) modn = r’s’ mod n = 
r" mod n * s’ mod.n, und dies ist nach (5.3.3.1) und (5.3.3.2) identisch mit xv mod .n. 


Anmerkung: Die scheinbare Kompliziertheit, dass der Rechner ein solches Bit b wählen 
muss, ıst dadurch begründet, dass es leicht möglıch wäre, jeweils einen solchen Wert r für 
den ersten oder den zweiten Fall zu finden, d.h. ein Betrug wäre leicht möglıch. Dadurch, 
dass der Authentikationsprozess jedoch dieses zufällige Element besitzt, kann kein Angreifer 
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vorhersagen, welches Bit ermittelt wird, d.h. auf welchen der beiden Fälle er sıch einstellen 
97 
muss”. 


Ein konkretes Beispiel: Sehen wir uns den Mechanismus des Fiat-Shamir-Protokolls zur 
Illustration an einem (natürlich wıeder einfach gehaltenen) Zahlenbeispiel an. 


Es seien p:=19, q:=23 und damit n=437. Der Wert s werde gewählt als s:=305. (305 ist 
teilerfremd zu n=437.) v=s“ ergibt sich damit zu v=s°=381. (Denn: 305*305 = 93025 = 
212*437+381.) 


Nun wählt der Benutzer eine Zahl r, die teilerfremd zu n=437 ıst. Wır wählen r:=107. Damit 
ist nach (5.3.3.2) x = 107*107 mod 437 = 11449 mod 437 = 87. 


Dieser Wert x wird an den Authentikationsrechner geschickt, der nunmehr ein Bit b 
“auswürfelt”. Nehmen wiır an, b wäre l. 


Damit wırd der Benutzer aufgefordert, y := rs mod n zu ermitteln und senden. Hier ist das: 
y = 107*305 mod 437 = 32635 mod 437 = 297. 


Jetzt überprüft der Rechner, ob y’modn =xv mod.n gilt: 


y’ mod 437 = 297*297 mod 437 = 88209 mod 437 = 372; entsprechend ist x*v mod 437 = 
87*381 mod 437 = 33147 mod 437 = 372. - Aha. 


Hätte der Rechner dagegen das Bit b=0 ermittelt, dann wäre der Benutzer aufgefordert 
worden, y :=r mod n zu berechnen. Hier: y = 107 mod 437 = 107. Diesen Wert erhält der 
Rechner, und der berechnet y’ mod n = r? mod n = 87 = x. (In diesem Falle war diese 
Rechnung trıvial, denn y und r waren identisch!) 


5.4. Asymmetrische Verfahren (Public Key) 


5.4.1. Allgemeines zu asymmetrischen Algorithmen 
Die bisher behandelten symmetrischen Verfahren haben zwei wesentliche Eigenschaften: 


l. Sender und Empfänger nutzen denselben Schlüssel, können also ım Prinzip jeweils 
sowohl Ver- als auch Entschlüsseln. 


2. Die zweı Partner müssen über irgendeinen Kommunikationsweg den gemeinsamen 
Schlüssel austauschen (können). 


1976 wurde von Diffie und Hellman [DifHel76] vorgeschlagen, von diesen Eigenschaften 
abzuweichen und asymmetrische Algorıthmen zu verwenden. Dadurch entfällt die 
Problematik des notwendigen sicheren Schlüsseltausches, ınsbesondere ım Rahmen der 
weltweiten Computer- und Kommunikationsvernetzung ein wichtiger Aspekt. Es ıst 
schließlich nıcht immer möglıch, mit einem Einschreibebrief einem Empfänger einer 
elektronischen Mail zuvor einen Schlüssel ‚auf sıcherem Wege” zuzustellen! 


°" Dieser Mechanismus wırd ın [Beutelspacher] (S. 95ff) sehr schön an einem sog. “Quadratwurzelspiel” illustriert. 


-112 - 


Nachfolgend wollen wır davon ausgehen, dass jeder Teilnehmer T eines asymmetrischen 
Kryptoverfahrens zweı Schlüssel besitzt: einen öffentlichen (public key) Er (=encrypt) zur 
Verschlüsselung und einen geheimen privaten Dr (=decrypt) zur Entschlüsselung. 


Wichtig ıst, dass der Schlüssel Dr durch die Kenntnis von Er nıcht hergeleitet werden kann. 


Die Public Keys solcher Verfahren sınd ın öffentlich zugänglichen Dateien, im Rahmen des 
Internets auf sogenannten Schlüssel-Servern, frei zugänglich. Die Private Keys sınd natürlich 
nur dem jeweiligen Besitzer bekannt (bzw. liegen vermutlich auf einem hoffentlich nur dem 
Besitzer zugänglichen Speichermedium). 


Drücken wir das Chiffrieren (E) und Dechiffrieren (D) formelhaft aus, dann muss für ein 
asymmetrisches Verfahren gelten: 


Für jede Nachricht m (message) ıst D(E(m)) = m. 


Für ein asymmetrisches Sıgnaturschema, mit dem beispielsweise elektronische Mails 
lediglich unterschrieben (signiert) werden sollen, muss dagegen ‚‚nur” gelten, dass mittels des 
öffentlichen Schlüssels E überprüft werden kann, ob bzw. das m und Dem) 
„zusammenpassen”. Dies kann im Zweifelsfall auch durch Berechnung einfacher Prüfziffern 
etc. realisiert werden. 


Soll eine Nachricht von Teilnehmer A an Teilnehmer B gesandt werden, so besorgt sich A 
den öffentlichen Schlüssel Es von B, verschlüsselt dıe Nachricht m damit und schickt Er(m) 
an B. Dieser wiederum ıst nach Voraussetzung der einzige, der den privaten Schlüssel D» 
besitzt und somit die Nachricht wıeder erlangen kann: Dz(Es(m)) = m. 


Es ıst anzumerken, dass hıerbei nur dıe beiden Schlüssel des Teilnehmers B zum Einsatz 
kommen, und dass kein geheimer Austausch von Schlüsseln (über irgendeinen als sicher 
eingestuften Kommunikatıonskanal) erforderlich ist! 


5.4.2. RSA: Mathematische Grundlagen 


1977 kreierten Ronald Rıvest, Adı Shamir und Leonard Adleman ein Public-Key-Krypto- 
verfahren, das nach ihnen benannte RSA, das auf dem Satz von Euler beruht. Diejenigen, die 
Mathematik überhaupt nicht leiden können, nehmen bitte einfach nur zur Kenntnis, dass es 
Euler gegeben hat. Die anderen können weiterlesen... 


Für eine natürliche Zahl n definieren wır als d(n) die Anzahl der zu n teilerfremden 
natürlichen Zahlen zwischen 1 und n (einschließlich). Die Funktion 6 heißt Zuler-Funktion. 
Anders ausgedrückt gıbt 6(n) an, wıeviele der Zahlen k zwischen 1 und n mit n den größten 
gemeinsamen Teiler I haben: ggT(k,n)=1. 


An konkreten Beispielen: o(1)=1, 6(2)=1, 6(63)=2, 0(4)=2, 6(5)=4, 6(6)=2, O(10)-4, 
6@31)=30. 


6(10) ergibt sıch beispielsweise so: mit 10 haben die folgenden Zahlen zwischen 1 und 10 
den größten gemeinsamen Teiler 1: 1, 3, 7, 9, also vıer Stück. 
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Generell gilt: 


l. Für eine Primzahl” p gilt stets: 6(p)=p-1. 


2. Sınd p und q zwei verschiedene Primzahlen, so ıst 6(pq)=(p-1)(q-1). 
Die erste Aussage ist trivial; die zweite Aussage folgt aus der Überlegung, dass zwischen 1 
und pq gerade die Vielfachen von p und die Vielfachen von q nicht teilerfremd” zu pq sind. 


Dabei handelt es sıch also um die Zahlen p, 2p, 3p, ...., (q-l)p und um q, 2q, ...., (p-1)q sowie 
natürlich um pq selbst. Also sınd zwischen 1 und pq teılerfremd zu pq: 


pq 1 -(q-1)-(p)=pg-q-p+1l=(p-IIq-). 
Damit kann der Satz von Euler formuliert werden: 
Sind m und n zwei natürliche Zahlen, die teilerfremd sınd, so gilt: 
m’® modn=1. 


Einen Beweis wollen wır an dieser Stelle nıcht geben; dieser findet sıch ın jedem besseren 
Buch zur Zahlentheorie (vgl. etwa [NiıvZuc]). 


Weiterhin ıst für uns die sogenannte modulare Inverse von Bedeutung. Sind a und b ganze 
Zahlen und d deren ggT, so gıbt es Faktoren x und y mitd=xa + yb. 


Sınd a und b teilerfremde Zahlen, das heisst: ıst der ggT von a und b gleich 1, dann exisitiert 
eine ganze Zahl c mit der Eigenschaft be mod a = 1. Das bedeutet, bc lässt bei Teilen durch a 
den Rest 1. Die mathematische Formulierung hierfür ıst: b ıst modulo a invertierbar. 


5.4.3. RSA: Der Algorithmus 


Wenden wir uns nun der eigentlichen Frage, der RSA-Verschlüsselung, zu. Für jeden 
Teilnehmer sınd ein öffentlicher und ein privater Schlüssel festzulegen. Hierzu werden zwei 
„große” Primzahlen p und q bestimmt und deren Produkt pq = n berechnet. Nach dem obigen 
ist O(n)=O(pq)=(p-1)(q-1). Schließlich werden zweı Zahlen e und d errechnet, für die die 
Beziehung 


(5.4.3.1) e.dmod 6(n) = 1 
gilt. 


Die beiden Zahlen e und n werden als öffentlicher Schlüssel weitergegeben, d ıst der private 
Schlüssel’. Dabei steht e auch für „Exponent”, n ist der Modul. Eine Nachricht, die 
verschlüsselt werden soll, besteht ın der Praxis aus einer Sequenz von Zeichen eines 
bestimmten Codes. Meıst wırd dies heute eine Form des ASCII seın, das spielt für die 
grundsätzliche Verschlüsselung aber keine Rolle. 


Nehmen wır für das Prinzip einfach an, wır würden nur eine Zahl m verschlüsseln wollen, 
wobei m kleiner als n seı. 


” Zur Erinnerung: Eine Primzahl ist eine Zahl p, dıe nur durch sich selbst und durch 1 ohne Rest teilbar ist. 1 selbst wird 
per definitionem nıcht als Primzahl betrachtet. 

” Zwei ganze Zahlen m und n heißen teilerfremd, wenn der größte gemeinsame Teiler von m und n gleich 1 ist. Anders 
formuliert: keine ganze Zahl größer als 1 teılt m und n gleichzeitig (ohne Rest). 

100 Wir erinnem an dıe Abkürzungen: e stand für encrypt, verschlüsseln, d für decrypt, entschlüsseln. 
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Dann wird die Zahl m verschlüsselt durch die folgende Formel: 
(5.4.3.2) c:=m’modn 


Wendet man auf diese chiffrierte Zahl (oder allgemein: Nachricht) mittels des geheimen 


Schlüssels d die nachstehende Formel an, so erhält man die ursprüngliche Zahl m wieder’. 


(5.4.3.3) m=c’modn 


Beispiel: Um die ganze Mathematik etwas greifbarer zu machen spielen wır den 
Mechanismus eınmal mit konkreten Zahlen durch, die natürlich zu Demonstrationszwecken 
absichtlich (relativ) klein gewählt wurden. 

Seien p=3 und q=5, dann sınd n = pq = 15 und d(n) = (3-1)(5-1) = 8. Nun müssen wır e und d 
bestimmen, so dass die Beziehung (5.4.3.1) gilt. Einfache Werte sınd zB.e=3undd=11, 
denn 33 mod 8 = 1. 

Soll nun die Zahl m = 13 verschlüsselt werden, dann geschieht dies mit der Formel (5.4.3.2), 
wir erhalten so: c = 13° mod 15 = 2197 mod 15 = 7. Und das Dechiffrieren mittels (5.4.3.3) 
ergibt erwartungsgemäß wieder m: 7'' mod 15 = 1977326743 mod 15 = 13. 


In der Praxis muss ein geeigneter Modul n „sehr groß” sein, d.h. nach gängıger Handhabung 
derzeit mindestens 150 bis 200 (Dezimal-)Stellen besitzen. Den geheimen Schlüssel d zu 
knacken bedeutet mathematisch, die Zahl n in ihre Primfaktoren p und q zu zerlegen bzw., 
was dazu äquivalent ist, d(n) zu bestimmen’. 


Aufgrund des sehr hohen Rechenbedarfs wırd der RSA-Algorıthmus heutzutage vor allem für 
Signaturen'"’ (Unterschriften) und für einen sicheren Austausch von Schlüsseln verwendet. 


5.5. PGP - Pretty Good Privacy 


PGP steht für Pretty Good Privacy und ist ein Verschlüsselungsprogramm. Mıt PGP lassen 
sich beliebige Texte - insbesondere natürlich auch elektronische Mails - verschlüsseln. Es 
wurde 1990 von Philipp Zimmermann in den USA entwickelt. Er wurde daraufhin wegen 
Verstoß gegen das US-amerikanische Waffenexportgesetz verfolgt! Das Vergehen 
Zımmermanns bestand darın, dass er PGP über Newsgruppen des Usenets verbreitet hatte. 
Die Anklage wurde jedoch schlussendlich fallengelassen. 


Mıt PGP können zum einen Texte chiffriert werden (so dass sıe nur der rıchtige Empfänger 
lesen kann), andererseits kann man damit Texte sıgnieren, d.h. unterschreiben (so dass sıch 
jeder vergewissern kann, dass der Text wirklich von dem angegebenen Absender kommt und 
nıcht verändert wurde). 


PGP benutzt dazu u.a. die Verschlüsselungsverfahren IDEA und RSA. 


IDEA (International Data Encryption Algorithm) ıst ein symmetrisches Verfahren, das PGP 
IDEA zur Verschlüsselung der Botschaft verwendet. 


1%! Den mathematischen Beweis, dass m = m““ mod n gilt, können Sie in [Beutelspacher], S. 131f, nachlesen. Wenn Sie 
wollen. 

1%2 Als anschauliches Beispiel: 1994 wurde eine 129-stellige Zahl unter erheblichem Aufwand faktorisiert. 

1% Hierzu muss lediglich ein sogenannter Hashcode für die betreffende elektronische Mail errechnet und verschlüsselt 
werden, was die Performance nicht ın dem Maße belastet, wıe es die Verschlüsselung der gesamten Mail mit sich 
brächte. 
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„IDEA arbeitet mit einer konstanten Schlüssellänge von 128 Bit und verschlüsselt die 
Botschaft ın Blöcken von je 64 Bit. Der Hauptschlüssel wird zuerst in acht Unterschlüssel zu 
je 16 Bit geteilt, dann wird er um 25 Stellen nach links gerückt und wieder in acht 
Unterschlüssel geteilt. Dies wırd sooft wiederholt, bıs insgesamt 52 Unterschlüssel generiert 
wurden. 


Dann wird der erste 64 Bit-Block ın vier Teile zu je 16 Bit zerlegt. Aus diesen vier Teilen 
werden mit Hilfe der ersten sechs Unterschlüssel in 14 Rechenschritten vier neue Textblöcke 
errechnet. Dieses Verfahren wird insgesamt acht mal durchgeführt, wobei ın jedem 
Durchgang mit den vier Ergebnis-Textblöcken des vorigen Durchgangs begonnen wird und 
dıe jeweils nächsten sechs Unterschlüssel zur Verschlüsselung verwendet werden. Mit den 
vier letzten Unterschlüsseln (von 52 wurden erst 48 verwendet) werden die letzten vıer 
Ergebnis-Textblöcke ein weiteres Mal verschlüsselt” '"*. 


Dies geschieht für alle 64 Bit-Blöcke der Reihe nach; schließlich ergeben alle Ergebnisse 
zusammen die chiffrierte Nachricht. Die Decodierung findet entsprechend ın umgekehrter 
Reihenfolge mit den entsprechend passenden „Umkehrschlüsseln” statt. 


Einen sehr informativen Beitrag zu PGP finden Sıe auch auf den Webseiten der Technischen 


Universität Chemnitz'!”. 


5.6. Anmerkungen zur Anonymität 


Bei Kryptographie dreht es sich um Verschlüsselung, Verheimlichung. Üblicherweise wird 
eine Nachricht chiffriert, das heißt: der Inhalt der Nachricht wird für Dritte (hoffentlich) 
unlesbar gemacht. Dagegen bleibt bei der Verschlüsselung einer eMail nachvollziehbar, dass 
von Sender A an Empfänger B überhaupt eine Nachricht gesandt wurde. 


Anonymität betrifft nun die, so betrachtet, noch ausstehenden Aspekte: das Geheimhalten des 
Senders und/oder Empfängers bzw. der Nachrichtenübermittlung als solcher. 


Bei politischen, geheimen Wahlen ıst derjenige, der seine Stimme abgıbt, also der Sender der 
Botschaft, geheim. Ebenso verhält es sich mit Bargeld: dıe konkrete Münze oder der spezielle 
Geldschein haben keın ‚„Protokoll” darüber, wer sıe wann ın seinen Händen hatte. Und auch 
in den mehr oder weniger beliebten Chats der Online-Dienste oder im Internet genießen die 
Teilnehmer ihre Anonymität’. 


Wie erreichen wır nun Anonymität des Empfängers? Ganz einfach: wenn wiır „allen” (oder 
zumindest „vielen”) dıe betreffende (verschlüsselte) Nachricht senden, dann kann nur der 
„passende” Empfänger decodieren, das heißt dıe betreffende Botschaft verstehen. 


Aber auch das Verfahren, das bei Briefwahlen stattfindet, führt zu einer Methode, 
Anonymität des Empfängers zu erreichen. Hierzu stelle man sıch vor, dass ein Brief ın einem 


1% Zitiert nach Thomas [Landauer], http://www.unet.univie.ac.at/-a9204810/PGP.htm. 

1% Die URL der Seite des Autors Holger [Trapp] ıst http://www.tu-chemnitz.de/-hot/pgp.html. Damit die Leserinnen und 
Leser des vorliegenden Textes nun nıcht gleich ın das Internet gehen müssen, haben wır ım Anhang einen Auszug dieser 
Webseite wiedergegeben (siehe Abschnitt A.3 auf Seite 240). 

196 Dabei ist diese Anonymität „relativ”: ım Rahmen des Online-Dienstes kann durchaus bekannt sein, über welche 
Telefonleitung beispielsweise sıch ein Teilnehmer eingewählt hat. Und auch ım Internet-Chat hinterlassen dıe beteiligten 
Rechner üblicherweise ıhre digitalen Spuren. 
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zusätzlichen Umschlag an eine Weiterverteilungsadresse geschickt wird, wo dann der äußere 
Umschlag entfernt wird. Und erst auf dem inneren Briefkuvert steht dann die eigentliche 
Zieladresse, dafür muss hier selbstverständlich (auch) keine Absenderangabe gemacht 
worden sein. 


Schließlich bleibt zu hinterfragen, wıe Dritten gegenüber die Tatsache verheimlicht werden 
könnte, dass überhaupt eine Nachricht übertragen wurde. Dies kann dadurch erreicht werden, 
dass „immer” oder zumindest „sehr oft” irgendwelche (Dummy-)Nachrichten gesendet 
werden. Dann fällt die eine „echte”” überhaupt nıcht mehr auf, das eventuelle Abhören der 
Datenübermittlungen und die damit verbundenen Entschlüsselungsversuche müssen fast 
zwangsläufig scheitern. 


Am Rande seı hier auf das relativ neue Gebiet der Steganographie hingewiesen. Dabeı 
handelt es sich um dıe Technik, Nachrichten „unsichtbar” in (beispielsweise) Graphiken 
einzubetten. Diese Methode hat in den letzten Jahren erheblichen Zuspruch gefunden. Aus 
Platzgründen können und wollen wir an dieser Stelle hierauf nicht weiter eingehen”. 


1%” Interessierte finden im Intemet zahlreiche Quellen zur Steganographie, ua. Sei die Website 
http://www.steganography.com/ erwähnt. Dort ıst unter http://www.steganography.com/english/steganos/sd_dl.htm eın 
Tutorial zur Steganographıie zu finden. 
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6. THEORETISCHE INFORMATIK UND COMPILERBAU 


Das Themengebiet Theoretische Informatik umfasst an der Universität die Teile 
Compilerbau, Formale Sprachen, Automatentheorie, Berechenbarkeit und Entscheidbarkeit, 
Algorıthmen und Datenstrukturen sowie Künstliche Intelligenz. Wir wollen uns hier aus 
Platzgründen nur mit einigen Aspekten beschäftigen”. 


6.1. Einführung in Aspekte der Theoretischen Informatik 


6.1.1. Entscheidbarkeit und Berechenbarkeit (Einblick) 


Ein fundamentaler Begriff der Informatik ıst der des Algorithmus. Für viele Problem- 
stellungen existieren Algorithmen; die folgerichtig spannende Frage ıst: gibt es 
Problemstellungen, für dıe es keinen Lösungsalgorithmus gibt? 


Lange Zeit glaubte man, dass man ein Problem lediglich präzise genug formulieren müsste, 
damit es einen Algorıthmus zu dessen Lösung auch tatsächlich gibt oder man wenigstens 
beweisen kann, dass gar keine Lösung existiert. 


Einer der bekannten Befürworter dieses Glaubens war der Mathematiker David Hilbert: "Fin 
bestimmtes mathematisches Problem muss notwendigerweise einer exakten Lösung 
zugänglich sein, entweder in Form einer direkten Antwort auf eine gestellte Frage, oder 
durch den Beweis seiner Unlösbarkeit und dem damit verbundenen notwendigen Scheitern 
eines jeden Versuchs." 


Hilberts Ziel war es, ein mathematisches System aufzustellen, ın dem alle Probleme exakt als 
Aussagen formulierbar sınd, dıe entweder wahr oder falsch sind. Seine Vorstellung war es, 
einen Algorithmus zu finden, der zu einer gegebenen Aussage ın einem formalen System 
entscheidet, ob dıe Aussage rıchtig oder falsch ist. 


Die Wahrheit einer Aussage ın einem formalen System zu entscheiden, ıst unter dem Namen 
Hilbertsches Entscheidungsproblem bekannt geworden. In den Dreißiger Jahren zeigte eine 
Reihe von Ergebnissen, dass dieses Entscheidungsproblem nicht „berechenbar” ıst, d. h. dass 
es keinen solchen Algorıthmus gıbt, wıe Hilbert ıhn sıch vorstellte. Ein solches Resultat war 
1931 das Unvollständigkeitstheorem von Kurt Gödel'”, das u. a. besagt, dass es keinen 
Algorıthmus geben kann, der als Eingabe irgendeine (beliebige) Aussage über dıe natürlichen 
Zahlen erhält und feststellt, ob diese Aussage wahr oder falsch ıst. Mit dem mathematischen 
Begriff der Widerspruchsfreiheit spielend lässt sıch als weitere verblüffende Konsequenz des 
Gödelschen Unvollständigkeitssatzes formulieren: /st die Mathematik widerspruchsfrei, so 
lässt sich ihre Widerspruchsfreiheit nicht mathematisch beweisen!'"” 


198 Etwas ausführlicher finden sich die hier besprochenen Themen in [Baeumle2]. 

1% Kurt Gödel: Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme I. Monatshefte für 
Mathematik und Physik 38 (1931). 

110° Mathematisch interessierte und bewanderte Leser finden ausführlichere und logisch präzise Darstellungen des 
Gödelschen Unvollständigkeitstheorems ın dem Buch Einführung in die mathematische Logik [EbbFluTho]. 
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Eın konkretes Beispiel für Nicht-Berechenbarkeit ıst das sogenannte Halteproblem: Ist für ein 
beliebiges Programm (= einen beliebigen Algorithmus) bestimmbar, ob es eine Endlos- 
schleife enthält? Die Antwort auf das Halteproblem ıst (bzw. wäre) ein Algorıthmus A, der 
zu einem gegebenen Programm P und seinen Eingabedaten D aussagt, ob P jemals halten 
wird, wenn es mit den Eingabedaten D ausgeführt wird. 


Im Alltag begnügt man sıch mit der Vorgabe eines Zeitlimits, innerhalb dessen ein Programm 
ausgeführt sein muss; benötigt es mehr Zeit als vorgegeben, so wird sein Abbruch 
erzwungen. Aus zweı Gründen ist dies jedoch keine Ideallösung. Zum einen verschwenden 
nıcht innerhalb der vorgegebenen Zeit beendete Programme die gesamte, ihnen zugewiesene 
CPU-Zeit; zum anderen kann es natürlich auch sein, dass ein Programm just vor seiner 
erfolgreichen Beendigung abgebrochen wird! 


Nachfolgend wird gezeigt, dass das Halteproblem nicht lösbar ist. 


Annahme: Es sei A ein Algorithmus, der zu den Eingaben P (Programm) und D (Daten, die 
das Programm P verwendet), entscheidet, ob P(D) stoppt oder endlos läuft. Stoppt 
P(D), so soll A "Ok" sagen, andernfalls sagt A "Nicht Ok". 


Betrachten wir nun den Algorithmus B, der zu der Eingabe P (Programm) stoppen soll, wenn 
A(P,P) "Nicht Ok" sagt, also wenn das Programm P auf sıch selbst angewendet nicht 
stoppt. Entsprechend soll B(P) ın eine Endlosschleife laufen, wenn A(P,P) "Ok" sagt. — Sehen 
wir uns an, was B(B) tut: 


1.Fall: B(B) stoppt. 
Das ist genau dann der Fall, wenn A(B,B) "Nicht Ok" sagt, 
und das ist genau dann der Fall, wenn B(B) nicht stoppt! 
Dies ist ein Widerspruch. 


2.Fall: B(B) stoppt nıcht, läuft also endlos. 
Das ıst genau dann der Fall, wenn A(B,B) "Ok" sagt, 
und das ıst genau dann der Fall, wenn B(B) stoppt! 
Dies ıst ebenfalls ein Widerspruch. 


Damit ıst die Annahme, es könnte solch einen Algorıthmus A geben, widerlegt. 


6.1.2. Übersetzerarten 


Ein Compiler ist ein spezieller Übersetzer. Üblicherweise werden Übersetzer unterschieden 
in 


a) Assembler 
Übersetzung einer low-level-Sprache in Maschinencode. 


b) Preprocessor 
Transformatıon einer "Obermenge" einer hıgh-level-Sprache ın dıe Sprache selbst. Diese 
Vorgehensweise ist bei der Sprache C’ oder der Embedded SOL-Programmıerung üblıch. 
Ebenso sınd einige frühe C++-Compiler lediglich Preprocessoren für die 
Programmiersprache €. 
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c) Compiler 
Übersetzung einer high-level-Sprache in Maschinencode oder eine andere (zumeist 
low-level-)Sprache. 


d) Interpreter 
Wie der Name bereits andeutet: hier wırd kein (statischer) Code erzeugt; in interaktiver 
Kommunikation des Programmierers mit dem Interpreter wird der Quelltext Schritt für 
Schritt ausgeführt ("interpretiert"). Dieses Prinzip findet man vor allem bei der 
Programmiersprache BASIC sehr häufig (auf dem PC z. B. in der Form von GWBASIC 
oder QBASIC), aber auch die objektorientierte Sprache Smalltalk wırd auf der Basıs eines 
Interpreters angeboten. 


Neben den verschiedenen Übersetzertypen können weitergehende Varianten von 
Übersetzungs-Systemen von Interesse sein. Dies sind ım wesentlichen 


a) Syntaxgesteuerte Editoren 
Das Programm wird mit Hilfe eines von der Programmiersprache abhängigen Editors 
eingegeben, der z. B. menügesteuert die Auswahl aus den verschiedenen Statement-Arten 
anbietet und Programmskelette zur Verfügung stellt. 


b) Inkrementelle Compiler 
Eingebettet ın eine Dialogumgebung ermöglicht der inkrementelle Compiler die 
Programmerstellung, Übersetzung und das Testen der Programme. Änderungen des 
Quelltextes verursachen keine Neuübersetzung des gesamten Programms, sondern nur der 
geänderten Inkremente. 


c) Disassembler, Decompiler 
Rückübersetzung von Maschinencode in Assembler oder eine high-level-Sprache. 
(Letzteres ıst ı.a. nicht möglıch, zumindest kann ın der Regel nıcht eindeutig rückübersetzt 
werden.) 


d) Transpiler 
Hier wird der Code einer high-level-Sprache ın eine andere high-level-Sprache 
transformiert. Solche Transpiler gibt es beispielsweise für dıe Umwandlung von 
Pascal-Code ın C oder von ForTran nach C. 


Im Folgenden wenden wir uns schwerpunktmäßig den Arbeitsschritten eines Compilers zu. 
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6.1.3. Compilerphasen 


Die Arbeit eines Compilers kann grob unterteilt werden in zwei Phasen(-gruppen): einmal eın 
Analyseteil, zum andern ein Syntheseteil; ein Compiler prüft in den Analysephasen zunächst 
den zu verarbeitenden Quelltext einer Pro- grammiersprache auf (lexikalische, syntaktische 
und semantische) Korrektheit und überführt ihn, falls diese Überprüfung zufriedenstellend 
verläuft, anschließend im Rahmen der Synthesephasen ın eine farget-language (Zıielsprache). 
Diese Überführung kann eventuell auch über Zwischensprachen erfolgen. Die Zielsprache ist 
der sogenannte object code, der ın der PC-Welt als .OBJ-Dateı und bei UNIX als .o-Dateı 
vorliegt. 


Quellcode (source code) 


Lexikalische Analyse 
y, Syntaktische N 
Tabellenverwaltung Semantische Analyse ————— Fehlerbehandlung 


Zwischencode-Erzeugung 


Optimierer (optimizer) 


Code-Erzeugung (code generation) 


Maschinencode (object code) 


Compilerphasen im Überblick 
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6.1.3.1. Lexikalische Analyse 


Eingabe ıst das Quellprogramm P, d. h. eine (endliche) Folge von Zeichen (Buchstaben, 
Ziffern, zulässige Sonderzeichen). Die Verarbeitung dieser Phase besteht darin, 
Grundsymbole aus den Zeichen zusammenzubauen. Beispielsweise wird das 
Pascal-Schlüsselwort begin aus den ASCII-Zeichen 'b', 'e', 'g', 'ı' und 'n! zusammengesetzt, dıe 
Zahl 357 wird aus den Ziffern (digits) '3', '5’ und '7' ermittelt. Dieser Vorgang wird auch als 
Scannen bezeichnet, ein Programm, das die lexikalische Analysephase realisiert, 


entsprechend als Scanner. 


Üblicherweise werden bereits in dieser Phase Tabellen bereitgestellt (initialisiert), in die 
später Bezeichner (identifier), Konstanten (Literale) und Datentypen eingetragen werden. Als 
Inıtialisierung sind hier bereits die Standardbezeichner festgehalten. 


Die Ausgabe ıst ein Programm P' ın Form einer Folge von Symbole. So kann etwa aus der 
Anweisung 


ıf <-> 0 then y ©=7; 
dıe Symbolfolge 


ifsym ident gtr number thensym ident assign number semikolon 


generiert werden'''. Hierbei wird die Ebene der einzelnen ASCII-Zeichen verlassen, d. h. es 


spielt insbesondere keine Rolle, ob das Pascal-Schlüsselwort i£f in Groß- oder ın 
Kleinbuchstaben geschrieben ist. 


In der Literatur wırd empfohlen, sıch für die Entwicklung eines Compilers auf eine feste 
Darstellung dieser "Token" festzulegen, z. B. auf (Art, Wert)-Paare (hier etwa: (keyword, 
'begin') und (number, 357)). Dann ıst es ırrelevant, ob der Wert direkt im Token vorliegt oder 
als Verweis in eine Tabelle. 


!! Hıer werden bereits die Symbol-Bezeichnungen des von uns später behandelten Parsers verwendet. Dabei steht ıfsym für 
das Symbol zum Schlüsselwort ıf, ıdent für Identifier, Bezeichner, gtr steht für greater, den größer-Operator, thensym 
steht für das Schlüsselwort then, assıgn für die Zuweisung (assignment), number für eine Zahl und semicolon für das 


Sonderzeichen ";", eben das Semikolon. 
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6.1.3.2. Syntaktische Analyse 


Eingabe ist das Programm P', das dıe lexikalische Analyse erzeugt hat. Es wird hier geprüft, 
ob die formale Aufeinanderfolge von Symbolen, die sogenannte Syntax der entsprechenden 
(Programmier-)Sprache erfüllt wird. Neben den Ergänzungen der Tabellen (Deklarationsteil) 
wird ein sogenannter abstrakter Baum A erzeugt (Statement-Teil). Dieser beinhaltet wichtige 
Informationen für dıe folgende semantische Analysephase und die anschließende Synthese. 


X:=2*PI*R assign 


A Da 


Eın abstrakter Baum 


Hierbei bedeuten: ıdent = Identifier, Bezeichner; const = Konstante; mult = Multiplikation 


6.1.3.3. Semantische Analyse 


Eingabe ıst der abstrakte Baum, den die syntaktische Analysephase erzeugt hat. Geprüft 
werden von der semantischen Analyse die Kontextbedingungen, z. B. die 
Typenverträglichkeit oder Typengleichheit. (Man bezeichnet dies als statische, zur 
Compilezeit überprüfbare Semantik; ım Gegensatz dazu steht die dynamische, erst zur 
Laufzeit relevante Semantik.) Den Knoten des abstrakten Baumes A werden semantisch 
relevante Informationen zugewiesen, es entsteht ein aftributierter abstrakter Baum A’und es 
werden die zu verschiedenen Symbolen notwendigen Informationen ın Symboltabellen 
eingetragen''”. Die Ausgabe der semantischen Analyse ist der erwähnte attributierte abstrakte 
Baum A’. 


112 Für einen Pascal-Compiler sind dies Informationen zu Bezeichnemn. Bei einem Compiler für C++ muss jedoch auch ein 
Eintrag für einen überladenen Operator + in dıe Symboltabelle vorgenommen werden, da das Symbol + (plus) hıer erst 
zusammen mit seinem Kontext (der Parameterliste) korrekt auszuwerten ist. 
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X:=2*PI*R assign 


Fa 


ident mult TYP- REAL 
X 


TYP: REAL 


ident 


mult 
P: REAL R 
/ TYP: REAL 


number const 


2 PI 
TYP: INTEGER TYP: REAL 


Eın attrıbutierter abstrakter Baum 


6.1.3.4. Zwischencode-Erzeugung 


Eingabe der Zwischencode-Erzeugung ıst der attrıbutierte Baum A®. Es wird eın 
Zwischencode P, erzeugt (in einer Zwischensprache Z), dessen Vorteil es vor allem seın 
kann, maschinenunabhängig zu sein. Die Ausgabe ist dieser Zwischencode P;. 


Der Zwischencode kann durchaus maschinenorientiert festgelegt werden. Zu denken wäre 
dabei an Zwei- oder Dreiadreßcode, je nach Komplexität. Beispiel: aus A:=B*C wird dann 
im ersten Fall''* (Mult B,C; Store Erg,A) und im zweiten Fall (Mult B,C,A). Seltener wird 
ein aufwendiger Einadresscode verwendet; für unsere Zwecke schließlich reicht eine 
symbolische Notation (siehe Abb. 1.5.). 


Außerdem seı darauf hingewiesen, dass ein Compilerhersteller ohne großen Aufwand 
Compiler für andere Programmiersprachen entwickeln kann, dıe denselben Zwischencode 
ansteuern. Um etwa einen Pascal-, einen C-, einen C++- und einen Java-Compiler für die 
drei Betriebssysteme UNIX, OS/2 und DOS zu entwerfen, sınd gemäß nachstehender Skizze 
somit nur wenige Bausteine erforderlich''*. Und andere Programmiersprachen sowie weitere 
Betriebssystemplattformen können leicht ergänzt werden... 


113 Mult steht hier wiederum als mnemonisches Kürzel für Multiplikation. "Store Erg, A" steht dabei für den Befehl, den 
Inhalt von A ın der Vanıablen Erg zu speichern. 

114 Hier wird für den Moment davon abstrahiert, dass üblicherweise Java-Compiler einen sogenannten Byte-Code erzeugen, 
der mit dem hıer vorgestellten Zwischencode nicht direkt vergleichbar ist. 
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Pascal C CHr Java ann 
Sprachen 


Zwischencode 


UNIX 0822 DOS ne 
Betriebssysteme 


Nutzung des Zwischencodes für verschiedene Sprachen und Plattformen 


6.1.3.5. Optimierung 


Die (optionale) Optimierungsphase nımmt den Zwischencode P; und eliminiert redundante 
(d.h. de facto wirkungslose) oder "tote" Anweisungen, optimiert Variablenzugriffe usw. Eine 
solche Phase ıst generell auch später, nach der Maschinencode-Erzeugung, noch möglich und 
in der Praxis vielfach realisiert. Ausgabe ist ein optimierter Zwischencode P; op. 


Beı der Optimierung wird generell unterschieden zwischen globaler und lokaler Optimierung. 
Dabei muss für dıe globale Optimierung eine Datenflußanalyse für das gesamte Programm 
durchgeführt werden, während bei der lokalen Optimierung nur Basisblöcke untersucht 
werden. Das sind Folgen von Anweisungen, dıe linear ohne Bedingungen durchlaufen 
werden (also von der ersten bis zur letzten Anweisung). 


Typische Optimierungen in Basisblöcken: 

— Konstanten erkennen und verbreiten (in andere Anweisungen übertragen), 
— Konstanten falten (Operationen mit Konstanten zur Compilezeit ausführen), 
— Algebraische Gesetze anwenden; 

— Überflüssige Anweisungen entfernen; 

— Speicherzugriffe optimieren (z. B. bei Array-Zugriff ın Schleifen). 
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WHILE (1 < P) AND (P < 3) DO P:=P+Q (= Dascal: =) 


IF 1 < P GOTO L1 (* Zwischencode *) 
GOTO L3 

IF P< 3 GOTO L2 

GOTO L3 

P:=P +OQ 

GOTO LO 


CONTINUE 


IF I -S=.'P.G070-Li (* optimierter *) 


Kleines Beispiel einer Optimierung im Zwischencode 


6.1.3.6. Code-Erzeugung 


Der übergebene Zwischencode P;.o„: (oder ggf. Pr, wenn keine Optimierung stattgefunden 
hat) wırd nun übersetzt ın den (endgültigen) Maschinencode P\. (Natürlich ıst dieser extrem 
hardwarenah und damıt maschinenabhängig! Nur selten gibt es sogenannte 
Binärkompatibilität, die einen Austausch von Maschinencode verschiedener Rechnersysteme 
ermöglicht.) 


6.1.3.7. Fehlerbehandlung 


Eine Fehlerbehandlung ıst grundsätzlich ın allen Phasen möglıch (und üblich), bei der 
Synthese sind dies jedoch nur noch Fehler ım Wechselspiel mit den konkreten 
Systembedingungen. Generell werden Fehlermeldungen ın eine Fehlerdatei bzw. 
Fehlertabelle (error table) geschrieben. 

Ein guter Compiler sollte Korrekturversuche (bzw. -vorschläge) vornehmen sowie nach 
Fehlern (auch nach "schlimmen") wıederaufsetzen können. Die Analysephasen sollten auf 
jeden Fall für das gesamte Programm durchgeführt werden, damit dıe Benutzer Hınweise zur 
Korrektur erhalten. 


Die möglichen (lexikalischen und syntaktischen) Fehler können verschiedenster Natur sein: 


sin (x fehlendes Zeichen (bzw. Symbol) 
if A then B; else C "überflüssiges" Zeichen 
funktion cosinus falsches Zeichen 

FNUICE ION es. vertauschte (verdrehte) Zeichen 


Probleme bei der Zuordnung eines Fehlers treten selbst in sehr einfachen Zusammenhängen 
auf. Beispielsweise ıst ba A := B #* C - D + E ) nicht ersichtlich, ob eine 
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schließende Klammer zuviel oder eine öffnende zuwenig geschrieben wurde. Und ım 
letzteren Fall: wohin gehört sıe? 


Einen theoretischen Ansatz einer Fehlerbehandlung liefert die sogenannte Minimale Distanz- 
Korrektur: mit Annahmen über die jeweilige Fehlerwahrscheinlichkeit wird diejenige 
Korrektur vollzogen, die den geringsten Aufwand bzw. Vertauschungsgrad bedeutet. Bei 
Gleichheit von Vertauschungen o. ä. werden die Wahrscheinlichkeiten zur Bewertung mit 
herangezogen. — Da dieser Ansatz extrem aufwendig ist, wırd er in der Praxis meist nıcht 
realisiert! 


Etwas sımpler gestrickt ıst da der Panık-Modus: ab der Stelle, an der ein Fehler auftritt (d. h. 
präziser: vom Compiler registriert wurde), werden alle Zeichen ignoriert, bis wieder eın 
Symbol analysıert werden kann. 


So kann zum Beispiel bei dem Pascal-Fragment IF (A > B > C THEN ... die 
IF-Bedingung natürlich nicht korrekt analysıert werden; indes kann der Compiler bei dem 
Symbol (Schlüsselwort) THEN wieder aufsetzen, d. h. so weıterarbeiten, als ob alles korrekt 
gewesen wäre, und ordnungsgemäß einen Fehler in dem davorstehenden (mißglückten) 
booleschen Ausdruck melden. 


6.2. Formale Sprachen 


Die zuvor vorgestellten Analysephasen des Compilers wurden auf Basis der sogenannten 
Formalen Sprachen entwickelt. 


Eine Sprache kann — wıe mathematisch jede Menge - festgelegt werden durch eine komplette 
Liste aller gewünschten Elemente. Aber schon beı den natürlichen Sprachen wird auf diesen 
Aufwand verzichtet, indem Regeln zur Konstruktion aller möglichen Sätze definiert werden. 
Wır alle beherrschen diese Regeln mehr oder weniger gut. 


Beı den Formalen Sprachen betrachten wır — ım Zusammenhang mit der Aufgabe, einen 
Compiler für eine Programmiersprache zu schreiben -— verschiedene Beschreibungs- 
mechanısmen für dıe Erzeugung aller "erwünschten" Zeichenfolgen einer Sprache. Wir lösen 
uns dabei z. T. von den umgangssprachlich geläufigen Begriffen wıe Zeichen, Wort, Satz. 


Beispiel: program mini(output); begin writeln('Hello, world!') end. ıst eine aus Zeichen 
zusammengesetzte Zeichenfolge (ein Wort), dıe einen Satz der Programmiersprache Pascal 
darstellt. 


Im nächsten Abschnitt beschäftigen wır uns zunächst mit der Spracherzeugung mittels 
Grammatıken. 


6.2.1. Spracherzeugung, Grammatiken 


Es seı eine Grundzeichenmenge © festgelegt, z. B. der ASCH-Code. (In der Regel ıst dieser 
Grundzeichenvorrat mıt dem Pascal-Datentyp char modellierbar.) 


Nachstehend sollen dıe wesentlichen Begriffe für dıe weitere Arbeit mit Formalen Sprachen 
vorgestellt werden. 
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6.2.1.1. Definitionen (Alphabet, Wort, Länge) 


l. Ein Alphabet A ıst eine endliche Menge von Zeichen, d. h. von wohldefinierten und 
wohlunterscheidbaren Elementareinheiten. (Mathematisch: A ıst eine Teilmenge von ®.) 


2. Ein Wort w über dem Alphabet A ist eine endliche Sequenz von Zeichen aus A. 
3. Die Menge aller Worte über dem Alphabet A wird mit A” bezeichnet. 


4. Die Länge eines Wortes w aus A’ ist definiert als die Anzahl der Zeichen in w. 
Notation hierfür: |w|. 


5. Speziell ist das Wort, das aus O Zeichen besteht, das sogenannte /eere Wort, das wir mit 
dem Symbol e bezeichnen wollen. 


6. Eine Sprache L (für "/anguage") ist eine Teilmenge von A’. 


7. Sind wı und w; Worte über A (also: wı, w» &e A), so heißt wıw; die Konkatenation von 
wı und w.». 


6.2.1.2. Beispiele (Alphabet, Wort) 


a) It A :={0,1 }, so ist w := 110 ein Wort über A (bzw. ein Element von A”). Die Länge 
von w ıst |w|=3. 


b)ItA:={a,b,c }, so sınd wı := aab und w; := cc zwei Worte über A. Die Länge von wı 
ist |wı| = 3, die von w> ıst |w2| = 2. Die Konkatenation der beiden Worte führt zu 
wıw»=aabcc, w»wı Ist entsprechend ccaab. 


c) SıA={x},Lı :={x,xwx,xxx, ... }, dann ist die Sprache L: nicht streng formal korrekt, 
dafür aber intuitiv verständlich angegeben. Offenbar sınd alle Worte über A mit 
Ausnahme des leeren Wortes € ın der Sprache L: enthalten. 


d) Sei A := { 0,1,2,3,4,5,6,7,8,9 und L: :={ we A| Das 1.Zeichen von w ist nicht 0; w ist 
nıcht das leere Wort }, dann beschreibt L> offenbar gerade die Sprache aller positiven 
Dezimalzahlen ohne führende Nullen. 


Nach diesen Beispielen ist es offensichtlich sinnvoll, sich Notationen zur dynamischen Her- 
oder Ableitung einer Sprache auszudenken. Dies führt (u. a.) zu den sogenannten 
Grammatıken. 


6.2.1.3. Definition (Grammatik, Terminalzeichen, Nichtterminalzeichen) 


Eine Grammatik G ıst ein Vıertupel (vornehm auch Quadrupel genannt) (N,T,S,P) und 
besteht aus einer Menge N von Nichtterminalzeichen, aus einer Menge T von 
Terminalzeichen, einem Startsymbol Se N und einer Menge P von Produktionsregeln. Dabeı 
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sind alle Mengen endlich, N und T haben keine gemeinsamen Elemente (d. h. sie sind 
dissunkt: NAT=&). 

Bevor wır ın Abschnitt 6.2.1.5. dıe formale Definition der Arbeitsweise einer Grammatik 
betrachten, hier eine kurze (umgangssprachliche) Beschreibung ihrer Funktion. 


Eine Sprache ıst bekanntlich eine Menge von Worten über einem Alphabet. Mithilfe einer 
Grammatik soll eine Sprache erzeugt werden. Mit den Produktionsregeln liefert die 
Grammatik dıe Vorschriften für diese Erzeugung. Dazu bedient sie sich nıcht nur der 
Zeichen, die ein Wort enthalten kann, sondern auch noch weiterer Zeichen. Da diese Zeichen 
nur während des Produzierens, nicht aber mehr ım erzeugten Wort auftreten, heißen sıe 
Nichtterminalzeichen, dıe Elemente des Sprachalphabets heißen analog Terminalzeichen. 


Die Nichtterminalzeichen dienen gewissermaßen als das Werkzeug, damit letztlich eine 
Folge, nur aus Terminalzeichen bestehend, gemäß den ın P genannten Produktionsregeln 
erzeugt werden kann: ausgehend vom Startsymbol werden sukzessive Produktionsregeln 
angewendet, bis sämtliche Nichtterminalzeichen ersetzt worden sınd. Eine solche 
Produktionsregel wird dabei notiert in der Form A ::= B, lies: A wird abgeleitet zu B. 


6.2.1.4. Beispiele (Sprache, Terminalzeichen, Nichtterminalzeichen) 


a) Zur Sprache L, aus Beispiel 6.2.1.2.c): 
Mit der Nichtterminalzeichenmenge N := { S, A } und der Terminalzeichenmenge T := {x 
» können Produktionsregeln P angegeben werden, dıe zur Erzeugung der Sprache L; 
dienen: 
Ss: = A, A: =xw,ÄA:=xÄA. 
Damit können die folgenden möglıchen Ableitungen skızzıert werden. 


Auf diese Weise entsteht (jeweils ın endlich vıelen Schritten) jeder mögliche Satz der 
Sprache L\. 
Der Begriff Erzeugung wird nachfolgend noch präzise definiert! 


b) Sei Lauı die Sprache aller Dualzahlen (0, 1, 10, 11 usw.). Dann erzeugt dıe nachfolgend 
genannte Grammatik G := (N, T,S,P) die Sprache Lauı. 
N={IS,A} 
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T:={0,1} 
P:={S:=0;, S:=1A; A:=0A,; A:=1A; A:r=el} 
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6.2.1.5. Definitionen (Ableitung u.a.) 


l. Als Grammatik-Alphabet wird die Vereinigungsmenge N U T von N mit T bezeichnet. 


2. Seı G eine Grammatik, G = { N, T, S, P }; seien v und w Worte über dem 
Grammatik-Alphabet. Dann sagen wir: w lässt sich direkt ableiten aus v (oder: w ist eine 
direkte Ableitung von v), wenn gilt: 
v=xUy,w=xzy, x,y,ze (NUT)*, Ue (NUT)*N(N U T)*, 

U :=z e P (ist eine Produktionsregel) 
Für diesen Sachverhalt schreiben wir v>w. 


3. v erzeugt w (bzw. w ist ableitbar aus v), falls es eine natürliche Zahl n > O und 
U0,...,Une€ (NUT)* gibt mit veW>U>...>un=w. Notation: v'>w. 


4. Eine Grammatik G heißt zyklenfrei, wenn für kein X e N gilt: X '> X, d. h. wenn es 
keine Zyklen gibt, bei denen von X ausgegangen wieder X erzeugt werden kann. (Dieser 
Begriff dıent faktisch nur dazu, sıch auf "sinnvolle" Produktionsregeln zu beschränken.) 


5. Eine Sequenz us,...,Un Mit Uo,...,Un € (NUT)* und WU >>...>un heißt Ableitung der 
Länge n. 


6. GiltS’>x füreinxe (NUT)*, so heißt x eine Satzform der Grammatik G. 


7. Eın Satz ıst eine Satzform, dıe nur aus Terminalzeichen besteht, d. h. mathematisch 
formuliert: x isteinSatz&(S'>x, xe T*). 


8. Die durch die Grammatik G erzeugte Sprache ıst die Menge aller Sätze und heißt 
L(G) ={xe T|S’>x}. 


9. Zwei Grammatiken G, und & heißen äquivalent, falls sie dieselbe Sprache erzeugen, d. h. 
wenn gilt L(G1)=L(G>) (Symbol: G, = G;). 


6.2.1.6. Beispiel (Grammatik, Ableitung) 


SeıG:={N,T,S,P} mitt N={S,A,B}, T:={a,b} und P definiert als dıe 
nachfolgende Menge von Produktionsregeln. 

[Sı:=AB; A:=a, A:=aA, B:=bb, B:=BB}. 
Dann sınd beispielsweise baba, AAa oder aabb Worte über dem Grammatik-Alphabet. aAbd 
ist ein Beispiel für eine Satzform und aaabbbb ist ein Beispiel für einen Satz der von G 
erzeugten Sprache L(G). 


Aufgabe für Sıe: Versuchen Sie bitte, L(G) verbal vollständig zu beschreiben. 
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6.2.1.7. Die Backus-Naur-Form 


Da es mitunter sehr mühselig ıst, eine Sequenz von Ableitungs- oder Produktionsregeln wie 
z. B. A::=B, A::=C, A::=D, A::=E (usw.) anzugeben, gibt es eine Konvention, sıch die 
Schreibarbeit etwas zu vereinfachen, dıe sogenannte Backus-Naur-Form (BNF). Die BNF 
findet sıch z. B. bei Pascal, wenn gesagt wird, dass ein vollständiges Pascal-Programm aus 
dem Programmkopf und dem Programmblock besteht. In BNF kann diese Aussage so 
aussehen: 
<program> ::= <program-head> <program-block>. 

Das heißt: häufig werden dıe Nichtterminalzeichen durch ın spitzen Klammern stehende 
selbstsprechende Abkürzungen dargestellt. Für die Notation der Produktionsregeln gelten 
folgende Abkürzungen. 


Mit "|" wird eine Alternative bezeichnet. 
A:=B|C|D stehtfür A::=B, A:=C, A:=D. 


Mit "£ ... $" wird O- oder mehrmalige Wiederholung dargestellt. 
S:={xxx } stehtsomit für S:=e S.=xxx$. 


Mit "[... ]" wırd eine Option (O oder einmal) gekennzeichnet. 
S:=[ A] stehtfür S:: =e, S:=A. 


Daneben können die gewöhnlichen runden Klammern verwendet werden, um eine 
Zusammenfassung auszudrücken. Oft werden auch zur Verdeutlichung die Terminalzeichen 
in doppelte Hochkommata gesetzt. 


6.2.1.8. Beispiel zur Backus-Naur-Form 


Eine Beispielgrammatık für ganz simple arıthmetische Ausdrücke könnte in BNF 
folgendermaßen angegeben werden. 


N = { S, <Ausdruck>, <Term>, <Faktor>, <Bezeichner> } 


ee en leraee r DZ 

P={S = <Ausdruck> , 
<Ausdruck> = <Term> [ "+" <Ausdruck> ], 
<Term> nn <Faktor> [ "*" <Term> ] 
<Faktor> I <Bezeichner> | "(" [| <Ausdruck> ] ")" , 


<Bezeichner> ::= "A" |"B" | "C" | "D" | "E" | "F" | 
SR 
"M" | "N" |"O” ["P" |"Q" "RC | 
"S" "TE "UN PVP "WOK" | 
u ir 
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6.2.1.9. Beispiel (COPY-Kommando) 


Nachfolgend sehen Sıe die (seit MS-DOS Version 5.0 verfügbare) Online-Hilfe des COPY- 
Kommandos. Die darin verwendeten eckigen Klammern sowie der senkrechte Strich stimmen 
in ihrer Verwendung mit der formalen Syntax der Backus-Naur-Form überein. Statt der 
intuitiven "..."-Schreibweise werden ın BNF jedoch die geschweiften Klammern verwendet. 


CErSCORV 72 


Kopiert eine oder mehrere Dateien an eine andere Position. 


COPY [/A | /B] Quelle [/A | /B] [+ Quelle [/A | /B] [+ ...]] 
[Ziel [/A | /B]] L[/V] 


Quelle Bezeichnet die zu kopierende(n) Datei(en). 
[A weist auf eine ASCII-Textdatei hin. 
/B Weist auf eine Binärdatei hin. 


Bezeichnet Verzeichnis und/oder Dateiname der neuen 


Datei(en). 


Überprüft, dass die neuen Dateien richtig 


aufgezeichnet wurden. 


Um Dateien aneinanderzuhängen, geben Sie eine einzelne Datei als Ziel 
an, aber mehrere Dateien als Quelle (unter Verwendung von Platzhaltern 


oder in der Form: Dateil + Datei2 + ...). 


Die obige Syntax-Zeile sıeht in Backus-Naur-Form so aus: 
COPY [/A | /B] source [/A | /B] { + source [/A | /B] } [destination [/A | /B]] /V] . 
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6.2.1.10. Syntaxgraphen (Syntaxdiagramme) 


Eine andere übliche Darstellungsform von Grammatıken (neben der BNF) sind 
Syntaxdiagramme oder Syntaxgraphen. 


Syntaxdiagramme bestehen aus den folgenden Komponenten: 


Eckige Kästchen: 


Bezeichner > 


Hiermit wird auf ein anderes Syntaxdıagramm verwiesen, das den Namen "Bezeichner" trägt. 


Runde (ovale) Symbole: 


Hiermit wırd ausgedrückt, dass an der entsprechenden Stelle genau das einzusetzen ist, was 
in dem runden Symbol steht, z. B. das genannte Schlüsselwort (hier "program"'). 


Konkatenation (Aufeinanderfolge): 


Dies steht für das, was das Syntaxdıagramm A ausdrückt, gefolgt von dem, was B beinhaltet. 
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Alternative (Verzweigung): 


* 


Dies steht für (wahlweise) eines der Syntaxdiagramme A oder B. (Entsprechend ist diese 
Diagrammform natürlıch auch für eine mehrfache Alternative verwendbar. ) 


die 


Dies steht für (nur) A oder die ein- oder mehrmalige Wiederholung von A. 


Wiederholungsstruktur: 


Option (Spezialfall der Alternative): 


14} 
Dies steht für "A oder nichts". 


Anmerkung: All diese Elementarbausteine sınd natürlich ineinander verschachtelbar. 
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Das Beispiel 6.2.1.8. sieht in Form von Syntaxdiagrammen aus wie folgt: 


Ausdruck 


Ausdruck 


Term 


Faktor 


Bezeichner 


Bezeichner i s 
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6.3. Automatentheorie 


Nachdem wır uns ım letzten Abschnitt mıt der Erzeugung von Sprachen verschiedener Typen 
beschäftigt haben, wollen wir uns nun dem Themengebiet der Spracherkennung widmen. 
Dabei wırd nicht mehr gefragt, welche Zeichenfolgen erzeugt werden können, sondern 
vielmehr danach, ob eine gegebene Zeichenfolge zu einer Sprache gehört, also korrekt ist. 


Ein (Beschreibungs-)Mittel für die Grundsymbole einer Programmiersprache ıst das Modell 
des Endlichen Automaten. 


6.3.1. Deterministische Endliche Automaten 


6.3.1.1. Beispiel 


Zum Einstieg wollen wır anhand eines einfachen Beispiels dıe Aufgabe der Spracherkennung 
verdeutlichen. 


Vielleicht kennen Sıe das Knobelspiel, bei dem ein Mensch die Aufgabe hat, mittels eines 
Bootes einen Wolf, eine Ziege und einen Kohlkopf von der einen auf dıe andere Seite eines 
Flusses überzusetzen. Nebenbedingungen: Er darf immer nur alleine oder mit einem der drei 
ım Boot übersetzen und außerdem dürfen nıe Wolf und Ziege oder Ziege und Kohl alleine am 
Ufer zurückbleiben, denn sıe haben sich zum Fressen gern. 


Hier geht es bei der Spracherkennung darum, eine vorgeschlagene Lösung zu prüfen. Schlägt 
etwa jemand vor, zunächst solle der Mensch mit der Ziege übersetzen, dann alleine zurück, 
dann mit dem Wolf zur Ziege und dann wieder alleine zurück, hat er oder sıe nıcht die 
richtige Lösung gefunden — das Lösungswort gehört nıcht zur Sprache der korrekten 
Lösungen! 


Anschaulich kann das gesamte Prüfverfahren mit Hilfe eines Deterministischen Endlichen 
Automaten (hıer ın bildhafter Form) dargestellt werden. Die Kreise symbolisieren die jeweils 
zulässigen Situationen an den beiden Flußufern, die Pfeile symbolisieren die Überfahrten, 
wobei dıe Bootsinhalte mit kleinen Buchstaben abgekürzt werden (m - Mensch alleıne, w - 
Mensch mit Wolf, z - mit Ziege, k - mit Kohlkopf). Korrekt sind dann alle Überfahrt-Folgen, 
die — beginnend beim Start-Zustand MWZK-0 - zum Endzustand 0-MWZK führen, der im 
nachfolgenden Bild mit einem doppelten Rand gezeichnet ıst. 
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k es W 
Start k n 


Ww k 
Z m 
4 
Z m 
Ein Endlicher Automat mit Mensch, Ziege, Wolf und Kohlkopf 


6.3.1.2. Definition (Deterministischer Endlicher Automat) 


Ein Deterministischer Endlicher Automat (DEA) ıst ein mathematisches Modell eines 
Systems mit endlich vielen Zuständen und diskreten Inputs (Zeichen für Zeichen). 


Dabeı hat ein Endlicher Automat kein "Gedächtnis", das heißt, er geht alleine aufgrund der 
Information seines momentanen Zustandes und des nächsten gelesenen Zeichens ın den 
folgenden Zustand über. 


Formal: Ein Deterministischer Endlicher Automat ist ein 5-Tupel (Z,A,d,90,E) bestehend aus 


l. Z: einer endlichen Menge von Zuständen, 
2. A: einem endlichen Alphabet, 


3. ö: einer Übergangsfunktion, die einem Zustand q e Z und einem gelesenen Zeichen ae A 
genau einen Zustand q’ zuordnet: q’= Ö(q,a). 


4. go: einem Startzustand (ausZ) sowie 


5. E: einer Menge der (möglıchen) Endzustände (Teilmenge von Z). 
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Zu einem Deterministischen Endlichen Automaten assoziieren wir ein Übergangsdiagramm 
und eine Übergangstafel, die beide darstellen, welche Zuordnungsvorschriften die 
Übergangsfunktion ö enthält. Beide Darstellungsformen werden anhand des nachfolgenden 
Beispiels erläutert. 


6.3.1.3. Beispiel und Definition (DEA, Übergangsgraph) 


Sei ein Deterministischer Endlicher Automat (Z,A,d,90,E) gegeben mit 


Zi >= { Go, Qı, 92, 43 h 
A={a,b}, 


Bi=1@3, 


sowie der Übergangsfunktion ö wie nachstehend in den beiden Darstellungsformen 
Übergangstafel und Übergangsgraph angegeben. 


Darstellungsform 1: Die Übergangstafel 


Bei der Übergangstafel eines Deterministischen Endlichen Automaten werden die Zeichen 
des Alphabets aufgetragen gegen dıe Zustände aus Z. In dıe betreffenden Felder der Matrıx 
wırd jeweils eingetragen, ın welchen Zustand der DEA wechselt, wenn er sıch ın einem 
bestimmten Zustand befindet und ein Zeichen liest. Die möglichen Endzustände werden 
dabei mit einem Plus-Zeichen "+" versehen. 


Darstellungsform 2: Der Übergangsgraph 


Beim Übergangsgraphen eines Deterministischen Endlichen Automaten wird, wie der Name 
schon sagt, graphisch dargestellt, in welcher Weise der DEA von einem Zustand ın einen 
anderen wechselt. Die folgende Skizze stellt denselben Deterministischen Endlichen 
Automaten dar wie obige Übergangstafel. 
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Ein Übergangsgraph (Übergangsdiagramm) 


Der hier gezeigte Automat akzeptiert (=erkennt) alle Worte, dıe mit dem String ab beginnen. 
Die Zustände q> und q; werden absorbierend genannt, da der Automat aus diesen Zuständen 
unabhängig von der Eingabe nicht mehr herauskommen kann. Einen absorbierenden 
Nicht-Endzustand wollen wir anschaulich Müllzustand nennen. 


6.3.1.4. Definition (erkannte Sprache) 


Ein Deterministischer Endlicher Automat M akzeptiert ein Wort w über dem Alphabet A 
genau dann, wenn er, ausgehend vom Startzustand go, bei zeichenweiser Abarbeitung des 
Wortes w sıch schließlich ın einem Endzustand befindet. Andernfalls wırd w nıcht akzeptiert. 
Die vonM erkannte Sprache L(M) ıst die Menge aller Worte, dıe M akzeptiert. 


6.3.1.5. Konvention 


Gelegentlich werden (aus Gründen der Übersichtlichkeit) Müllzustände nicht mit in das 
Übergangsdiagramm eines Endlichen Automaten eingezeichnet. Ein solcher 
(unvollständiger) Automat ist dementsprechend so zu interpretieren, dass jeder nıcht 
eingezeichnete Übergang in einen formal noch zu ergänzenden Müllzustand führt. Das 
entsprechend eingelesene Wort gehört damit jedenfalls nıcht mehr zu der Sprache, die der 
Automat erkennt. 
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6.3.2. Nichtdeterministische Endliche Automaten 


Neben den Deterministischen Endlichen Automaten gibt es noch eine (kleine) Erweiterung, 
die sogenannten Nichtdeterministischen Endlichen Automaten, bei denen ın Abweichung von 
den DEA die Übergangsfunktion ö nicht eindeutig zu sein braucht. Mathematisch präziser: 
die Übergangsfunktion ist im nichtdeterministischen Fall mengenwertig. 


6.3.2.1. Definition (Nichtdeterministischer Endlicher Automat) 

Ein Nichtdeterministischer Endlicher Automat (NEA) ist ein Fünftupel (Z,A,ö,g0,E) mit 
l. Z: einer endlichen Menge von Zuständen, 

2. A: einem endlichen Alphabet, 


3. ö: einer Übergangsfunktion, die einem Zustand q e Z und einem gelesenen Zeichen ae A 
eine (nichtleere) Menge von Zuständen Q' zuordnet: Q' = (q,a) . 


4. go: einem Startzustand (ausZ) sowie 


5. E: einer Menge der (möglichen) Endzustände (Teilmenge von Z). 


Die Definition der von einem Automaten akzeptierten oder erkannten Sprache gilt ent- 
sprechend auch für Nichtdeterministische Endliche Automaten. 


Der Unterschied zur Definition eines Deterministischen Endlichen Automaten liegt also 
lediglich in der Festlegung der Übergangsfunktion. Folgende Skizze zeigt das 
Übergangsdiagramm eines Nichtdeterministischen Endlichen Automaten. (Auch hier wird die 


oben erwähnte "Müll-Konvention" verwendet.) 
N 


a b 


Start b 


Ein Übergangsgraph (Übergangsdiagramm) 


Weitere Übungen und Betrachtungen ergeben, dass zum Entwerfen eines Automaten das 
Konzept des NEA äußerst praktisch ıst, gleichzeitig jedoch nıcht mehr Sprachen dadurch 
erkannt werden können. Anders formuliert: die Menge der von Nichtdeterministischen 
Endlichen Automaten erkennbaren Sprachen ıst identisch mit der Menge der von 
Deterministischen Endlichen Automaten erkannten Sprachen. Dies geht sogar soweit, dass es 
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einen Uberführungsmechanismus gibt, der zu einem NEA einen zugehörigen 
Deterministischen Endlichen Automaten konstruiert, der also dieselbe Sprache erkennt wie 
der Ausgangsautomat! 


6.3.2.2. Satz (Überführungsalgorithnmus NEA->DEA) 


Nachstehend wird ein Algorıthmus skizziert, der zu einem NEA den (bzw. einen) 
zugehörigen DEA konstruiert. 


Eingabe Ein Nichtdeterministischer Endlicher Automat N := (Z,A,d,g.,E) 


Ausgabe Ein Deterministischer Endlicher Automat D := (Z',A,d',‚Q.,E'), der 
äquivalent zu N ist, d. h. L(N)=L(D). 


Methode Jeder Zustand Q von D ıst die Menge der Zustände, dıe N beı derselben 
Eingabe erreicht haben könnte. 


Verfahren Initialisierung: Qo := { go } ıst Startzustand von D; Q, sei unmarkiert. 


SOLANGE es einen unmarkierten Zustand Q von D gibt: 
BEGIN 
FÜR JEDES a AUS A: 
BEGIN 
Sei Q' die Menge der Zustände des NEA, zu denen es für a einen 
Übergang von einem Zustand q aus Q gibt; 
FALLS Q' noch keın Zustand von D ıst, DANN mache Q' zu 
einem unmarkierten Zustand von D; 
Füge einen Übergang von Q nach Q' mit der Beschriftung a in den 
Automaten D eın, sofern dieser nıcht schon existiert 
END; 
Markiere Q 
END 


Anmerkung: Jedes Q ( = Zustand von D = Menge von Zuständen von N ), das einen 
Endzustand von N enthält, ıst ein Endzustand von D. 
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6.4. Compilerbau 


In dıesem Abschnitt ıst unser Ziel, die syntaktische Analyse von Programmtexten zu 
realisieren. Unser Weg wırd der Transfer von Syntaxdiagrammen (über die 
Backus-Naur-Form) hin zu Erkennungsprozeduren (sogenannten Parsern) sein. 


6.4.1. Einführung 


Sind beispielsweise dıe Ableitungsregeln S ::= AB, A ::= I und B ::= 2 gegeben, so ist es 
offensichtlich kein besonders aufregender Unterschied, den (einzigen) Satz der erzeugten 
Sprache 12 einmal über den Ableitungsweg S > AB=> A2 > 12 und ein anderes Mal über 
den Weg S > AB > IB > 12 herzuleiten. Diese Überlegung führt uns zur nächsten 
Definition, die solche eher banalen Unterscheidungen für unsere weiteren Untersuchungen 
ausklammert. 


Ist eine Grammatik G gegeben, so heißt eine Ableitung Zinksableitung (left-most derivation), 
wenn in jeder Satzform das am weitesten links stehende Nichtterminalzeichen abgeleitet 
wird. 


Dieser Begriff der Linksableitung bedeutet für unsere oben erwähnten Beispielregeln, dass 
der Ableitungsweg S > AB > 1B > 12 die Linksableitung für den Satz 12 ıst, denn jede 
Satzform (im vorliegenden Falle also S, AB, 1B) wird "von links" weiter abgeleitet. (Bei dem 
hierzu symmetrischen Weg spricht man konsequenterweise dann von einer Rechtsableitung. ) 


6.4.1.1. Beispiel (Ableitungen aus Regeln) 


Es seien die nachfolgenden beiden Grammatiken G, und G, vorgegeben, die beide eine 
(kleıne) Sprache von FExpressions (Ausdrücken) erzeugen. (Aus Gründen der 
Übersichtlichkeit werden jeweils nur die Produktionsregeln benannt. Die Mengen der 
Nichtterminal- und der Terminalzeichen sınd { S,E, T,F, U } bzw. {+,*, (, ), 0, 1,2, 3, 4, 5, 
6, 7,8,9 }. Das Startsymbol heißt, wie gewohnt, wieder S$.) 


G habe die Produktionsregeln: 
SE 
EEE "Tr > 
T2=17°7E)lE 
Ft. EU 
U 20° 111° 2° 3214759126811 °2° 870% 


(Dabei steht E für expression, T für term, F für factor und U für unit, hier also eine einstellige 
Dezimalzahl, allgemeiner könnte dies eın integer- oder real-Literal sein.) 


5 Regeln der Form E ::= E "+" T heißen linksrekursiv. 
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G; habe die folgenden Produktionsregeln: 
S- = .E 
E — "og" | “1 | "I | es | AN | ES | "6 | ng | ro" | "go" | 
E n_N E | E "x E | u E " 


Geben wir nun an, wie der (von beiden Grammatiken erzeugte) Satz /+2*3 abgeleitet werden 
kann. 


l.ZuG: S>SE>EHT>TTT>FT > Ur >1+tT > I+HT*F > I+HF*FF > I1+U*F > 
l#2°R => 142 *U>123 


2. Zu ©: Hier finden wir zwei Ableitungswege: 
(1)S=>E=>E+E=> HE => I+E*E => 1+2*E => 1+2*3 
und 
(2)S=>E=>E*E > E+E*E => I+E*FE => 142*E => 1+2*3 


Beachten Sıe bitte, dass beide Ableitungswege Linksableitungen sind und trotzdem diese 
zwei unterschiedlichen Wege existieren! 


Weg (1) führt unter Beachtung der üblichen Hierarchiebildung bei arıthmetischen 
Ausdrücken semantisch zu dem Ausdruck 1+(2*3), während Weg (2) ın dem 
Rechenausdruck (1+2)*3 mündet. (Klar?) 


6.4.1.2. Definition (Mehrdeutigkeit) 


Eine Grammatik G heißt mehrdeutig (ambiguous), wenn es (mindestens) einen Satz der von 
G erzeugten Sprache L(G) gıbt, der mehr als eine Linksableitung besitzt [bzw. zu dem es 
keinen eindeutigen Ableitungsbaum gibt]. 


Dabei entsteht ein Ableitungsbaum zu einem Satz der Typ-2-Sprache L(G), indem 
— ausgehend von der Wurzel, dıe durch das Startsymbol S gebildet wırd -— von Ebene zu 
Ebene Regelanwendungen dargestellt werden: An jedes Nichtterminalzeichen werden als 
Kindknoten dıe Elemente der rechten Seite der ın diesem Schritt angewendeten Regel 
angehängt. 


6.4.1.3. Beispiel (Ableitungsbäume) 


Es seien dıe folgenden Produktionsregeln (in Backus Naur Form) gegeben. 


S — <expression> 


<expression> :: <expression> "+" <expression> | 
<expression> "*" <expression> | 
<identifier> 


€ | I | NT 


<identifier> 
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Dann ıst der Satz X+Y*Z gleich auf zwei Weisen abzuleiten, wie dıe nachstehenden 
Ableitungsbäume zeigen. 


S 
| 
expression 
a 
expression + expression 
ıdent ıdent * ıdent 
| | | 
X Y Z 
S 
| 
expression 
Ei 
expression * expression 
ıdent ’ ıdent ae 
| | | 
X Y Z 


Beispiel für Mehrdeutigkeit 


In der Praxis ıst Mehrdeutigkeit möglıchst zu vermeiden, z. B. durch das Aufstellen von 
Konventionen, wıe wır es von der bekannten Punkt-vor-Strich-Regel kennen. Das heißt: ım 
obıgen Beispiel würde ein Pascal-Compiler den erstgenannten Ableitungsbaum erzeugen, da 
in ıhm die Grammatık G: umgesetzt ist, bei der dıe Operatoren gemäß der Vorrangstellung 
auf unterschiedlichen Ebenen auftreten. 
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Unser obiges Beispiel © ıst also eines für Mehrdeutigkeit, das eine solche Konvention 
erforderlich macht. 


6.4.1.4. Bemerkung: Mehrdeutigkeit ist nicht entscheidbar 


Mehrdeutigkeit ist nicht entscheidbar! Das heißt: es gibt keinen allgemein gültigen 
Algorıthmus, der zu einer vorgegebenen kontextfreien Grammatik entscheiden kann, ob sıe 
Mehrdeutigkeit beinhaltet! 


Wie bereits gesagt, wırd als Top-Down-Methode die Ableitung vom Startsymbol S 
ausgehend bezeichnet. — Was könnte ein Parser (= eine Erkennungsprozedur) bei 
Top-Down-Analyse und einer (ziemlich) beliebigen Typ-2-Grammatik versuchen? Sehen wiır 
uns dıe obige Grammatik G: an; nehmen wir wieder den Beispielsatz 1+2*3 her. Es ıst also 
abzuarbeiten das Startsymbol S; ım sogenannten Eingabeband (= Quelltext unserer 
Programmiersprache ın späteren Beispielen) steht 1+2*3. 


Schematisch: 


Satzform Eingabeband 


S 17275 
E 1323 
E+T 142%3 
E+T+T 1423 
... Endlosschleife! ... 


') Annahme hierbei: der Parser versucht, entsprechend der Nennung in der Grammatik, diese Regel zuerst! 


Top-Down-Analyse-Ansatz für 1+2*3 


Das heißt: weil die linksrekursiven Regeln''° (für E und T) in G: zuerst genannt werden, läuft 
unsere erste Parserversion ın eine Endlosschleife. (Eine solche Rekursion kann ım übrigen 
auch vıel "versteckter" ın Form einer sogenannten indirekten Rekursıon auftreten!) 


Nächster Ansatz ıst also die „Reparatur”, dıe darın besteht, alle lınksrekursiven 
Ableitungsregeln nach hinten zu setzen. Die Regeln von G1 haben dann diese Gestalt: 


SE 

Er 7.,E777 

2 

F2=10-E 9) U 

U =20> 747283774750 [7 20898 


116 Eine Ableitungsregel der Form X ::= XY heißt /inksrekursiv, da das abzuleitende Nichtterminalzeichen X - die linke 
Seite — auch auf der rechten Seite der Produktionsregel, und zwar als allererstes, wıeder auftritt. 
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Aber auch hier ergeben sich Probleme: spielen wır die Top-Down-Analyse von 1+2*3 
nochmals durch mit diesen Regeln. 


Satzform Eingabeband 


1+2*3 
1+2*3 
1+2*3 
1+2*3 
1+2*3 
1+2*3 
+2*3 


Hiermit wäre dıe "1" korrekt erkannt worden, alle Nichtterminalzeichen wurden abgearbeitet, aber: ım 
Eingabeband steht noch der unverarbeitete Rest "+2*3"! 


Weiterer Top-Down-Analyse-Ansatz für 1+2*3 


Im hier gezeigten Fall wäre also ein Backtracking erforderlich: das Parser-Programm muss, 
an einer Stelle wie im obigen Bild beschrieben angekommen, Schritt für Schritt zurückgehen 
(„backtracking” durchführen), bıs es mit alternativen Ableitungsregeln weitermachen kann! 
Dies bedeutet in der Praxis einen (sehr) großen Aufwand bereits für die Analyse eines solch 
einfachen Satzes wıe /+2*3 ! 


Gehen wir davon aus, dass eine Parser-Prozedur (wıe ın obigen Bildern angedeutet) den zu 
analysıerenden (Quell-)Text streng sequentiell liest, dann können wır uns das soeben 
aufgezeigte Problem auch anhand des prominenten if-then-else-Problems ansehen. 


6.4.1.5. Beispiel: Dangling-Else-Problem. 


In einer Programmiersprache sei die Syntax für ein ıf-Statement folgendermaßen (in 
Backus-Naur-Form) vorgegeben. 


<stmt> ::= _ ıf<cond> then <stmt> | 
if <cond> then <stmt> else <stmt> | 
<other-stmt> 


Sınd Cl und C2 boolesche (logische) Ausdrücke (conditions) und St] und St2 zweı konkrete 
Anweisungen (sitatements), dann ıst das ıf-Statement if C/ then if C2 then St! else S12 
mehrdeutig, was nachzuvollziehen ıst, wenn die Anweisung als Struktogramm dargestellt 
wırd. Entweder ıst der erste Ableitungsschritt der zur Sequenz if C/ then <stmt> mit der 
weiteren Ableitung if C/ then if C2 then St! else St2, oder aber die erste Ableitung führt zu if 
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C/ then <stmt> else St2 und der nächste Schritt zu if C/ then if C2 then St! else S12. 


St2 


Zwei Struktogramme zur Sequenz ifC1 then if C2 then Stl else St2 


Die Lösung dieses Problems, d. h. dıe Angabe anderer Ableitungsregeln, die dieselben 
ıf-Statements generieren, gleichzeitig aber ohne Mehrdeutigkeit auskommen, soll an dieser 
Stelle nicht verraten werden. Dies ist vielmehr Gegenstand der Übungsaufgabe Fehler 124: 
Feld endet nicht rıchtig. 


Insgesamt ıst also Ziel unserer ganzen Bemühungen, eine "sackgassenfreie" 
Top-Down-Analyse durchführen zu können. Das Problem ım Dangling-Else-Fall ıst, dass beı 
einer sequentiellen ("von oben nach unten") Lektüre eines Quelltextes nıcht festgestellt 
werden kann, zu welchem if das eine e/se gehört, da es zwei ifs gibt. 


6.4.2. First- und Follow-Mengen 


Nach dem oben Gesagten ist also einleuchtend, dass zu einer Ableitungsregel der Form 
xX:=0|%|..|o. mit XeN und se (NUT)* 

klar sein muss, welches (eindeutige) 6; für dıe nächste konkrete Ableitung genommen werden 

kann. 


6.4.2.1. Beispiel (First- und Follow-Problem) 


Seı G := (N,T,S,P) eine Grammatik mitt N: ={ S,A,B}T = ab, c } und den 
Produktionsregeln P:={S:=A|B, A :=cA|a,B::=cB |b }. - Dann ıst die von G 
erzeugte Sprache L(G) dıe Menge aller Sätze der Form c’a bzw. c’b (mitn > 0). 

Aber: bei der Analyse des Satzes ccca ist erst beim Lesen des Zeichens a klar, dass beı der 
allerersten Ableitung des Startsymbols S die Regel S ::= A verwendet werden musste! 


Dieses Beispiel legt den Wunsch nahe, dass beı Ableitungen der Form 

xX:ı=0|o]|..|o. mit XeN und se (NUT)* 
der Anfang jeder rechten Seite 6; zu einem eindeutigen Terminalzeichen führt, so dass durch 
Lesen nur eines weıteren Terminalzeichens die Parser-Prozedur weıß, welche 
Ableitungsregel ım nächsten Schritt anzuwenden ist. 


Formal: Lassen sich z. B. 0 (in mehreren Schritten) zur Terminalzeichenfolge tit»...t„ und © 
(evtl. ebenfalls in mehreren Schritten) zur Terminalzeichensequenz uınuz»...un ableiten, dann 
muss tızuı gelten. — Diese Forderung führt zur folgenden Definition. 
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6.4.2.2. Definition (First-Menge) 


Zucoe (NUT)* wird die First-Menge first(0) definiert wıe folgt. 


Für den Spezialfall 6 = e wird first(6) := & definiert; 
Ist 0 #&, so wird definiert 
first(6) = {te T|o’>tc', 0'e (NUT)* }. 


Hierbei steht 0° t0' für eine Ableitung in null oder endlich vielen Schritten. Das heißt z. B. 
first(t)= {t}fürte T. 


6.4.2.3. Beispiel (First-Mengen) 


Sei G := (N,T,S,P) eine Grammatik mıtN :={S,A }T = {t, + }, dem Startsymbol S und 
den Produktionsregeln P:={ S ::=tA, A = A +t, A ::=e& }. Dann ist dıe von G erzeugte 
Sprache L(G) = { t(+t)" | n>O }. - Die auftretenden first-Mengen sınd 

first(S) = { t }, first(A) = first A +t)= {+ } und first(e) = ©. 


6.4.2.4. Anmerkung (Typ-2-Grammatiken und First-Mengen) 


Sie werden bemerken, dass wir einerseits Typ-2-Grammatiken (kontextfreie Grammatiken) 
betrachten wollten, gleichzeitig aber im obigen Beispiel 6.4.2.3. eine e-Ableitung auftritt. 
Solche e-Ableitungen sollen ım Folgenden die einzige Ausnahme von der strengen 
Typ-2-Vorgabe sein. 


Ist e nicht selbst Element der Sprache, dann lassen sich Regeln der Form X ::= a Yß, Y = Y| 


£ leicht umformen zu X := aYB | aß, Y := Y. Wie wir auch bei unserem später zu 
betrachtenden Parser sehen werden, verzichtet man ın der Praxis auf diesen Mehraufwand. 


6.4.2.5. Beispiel (First-Mengen) 


Nehmen wir dıe Grammatik G aus Beispiel 6.4.2.1. Dann ıst first(A) = { a, c } und 
first(B) = { b, c }. Das dort dargestellte Entscheidungsproblem resultiert daraus, dass beide 
Nichtterminalzeichen ıdentische Terminalzeichen ın ıhren Fırst-Mengen besitzen. 


6.4.2.6. Beispiel (Mehrdeutigkeit der Ableitungen) 


Seı G := (N,T,S,P) mitN:={S,A,V4T :={+,0, 1 } und den Produktionen 
P:=1{8S:=1VA,V:=+lesA:=+0|+1|0|1}. 

Im hier vorliegenden Fall trıtt ein neues Problem auf: der Satz 1+1 ıst (wieder) mehrdeutig 

(links-)ableitbar: 

S>1I1VA>1HA>1+t1lbzwS> 1VAleA>letl, 

und das ıst ebenfalls 1+1! Diesmal resultiert das Problem aus der e-Ableitung für V! 
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Beispiel 6.4.2.6. führt uns zu einer weiteren Definition, die speziell ım Falle von 
e-Ableitungen zum Zuge kommen wird. 


6.4.2.7. Definition (Follow-Menge) 


Zu einem Nichtterminalzeichen X wird die Follow-Menge follow (X) definiert als die Menge 
all der Terminalzeichen, dıe ın Satzformen rechts von X auftreten können, formal: 


follow(X) = {te T|S > 01Xto;, 01,0: e (NUT)* }. 


In Beispiel 6.4.2.6. ıst das erwähnte Problem also formal dadurch beschreibbar, dass das 
Nichtterminalzeichen V, für das es eine e-Ableitung gıbt, sowohl ın seiner First-Menge 
first(V), als auch ın seiner Follow-Menge follow(V) das Terminalzeichen + beinhaltet. 
Deswegen kann beı sequentieller Analyse nıcht entschieden werden, ob V ::= e oder V ::=+ 
konkret verwendet werden muss. 


6.4.3. LL(1)-Grammatiken 
Die bisherigen Betrachtungen führen uns zur Formulierung zweier Regeln. 


Sei G := (N, T,S,P) eine (Fast-)Typ-2-Grammatık, d. h. zusätzlich zu den Typ-2- Regeln seien 
e-Ableitungen erlaubt. 


6.4.3.1. Regel 1 


Existieren für ein Nichtterminalzeichen X alternative Ableitungsregeln, 


xX:=01|9|..|o. mit XeN und se (NUT)*, 


so sınd dıe Fırst-Mengen der rechten Seiten dieser Ableitungsregeln paarweise disjunkt. 
Formal: für alle i#k ist first(6;) N first(o,) = ©. 


6.4.3.2. Regel 2 


Tritt (in Erweiterung des Begriffes kontext-frei) eine e-Ableitung des Nichtterminalzeichens 
X, d.h. X ::= eg, auf, so sınd die Fırst- und dıe Follow-Menge von X disjunkt. Formal: Ist 
X :=eınP enthalten, so ist first(X) N follow(X) = ©. 


Wenn diese beiden Regeln für eine Grammatik G erfüllt sınd, dann können wir unser 
Vorhaben, eine Parser-Prozedur für dıe Sprache L(G) zu implementieren, weiterverfolgen. 
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6.4.3.3. Definition (LL(1)-Grammatik) 


Eine Grammatik G heißt ZL(1)-Grammatik ["left-to-right-scanning, leftmost derivation, one 
symbol lookahead" |, wenn ihre Ableitungsvorschriften P den oben genannten Regeln 1 und 2 
genügen. 


Sprachen, dıe von solch einer Grammatik erzeugt werden können, bekommen ebenfalls einen 
eigenen Namen. 


6.4.3.4. Definition (LL(1)-Sprache) 


Eine Sprache L heißt ZL(I)-Sprache, wenn es eine LL(1)-Grammatık G gibt, die L erzeugt, 
d.h. für die L=L(G) sılt. 


6.4.3.5. Beispiel (LL(1)-Grammatik) 

Sei G := (N,T,S,P) gegeben mit N := {S,A,B },T := { 0, 1 } und den Produktionsregeln 
P:={S:=1Al|0Bl, A :=0A|1,B:>=0]le}. 

Dann sınd dıe LL(1)-Bedingungen zu prüfen: 


Die Mengen first(1Al) = £ 1 } und first(OBl) = { O0 } sind disjunkt, damit sınd die beiden 
Regeln für S erfüllt, die Fırst-Mengen first(0A) = { 0 } und fırst(1) = £ 1 } sınd ebenfalls 
dısjunkt. 


Für das Nichtterminalzeichen B muss (wegen der e-Ableitung) die Regel 2 überprüft werden: 


first(B) ıst offenbar (?) die Menge { 0 }, follow(B) lässt sıch nur durch Betrachtung der 
gesamten Grammatikregeln erfassen: dıe Produktionsregel S ::= OBl ıst die einzige, ın der 
das Nichtterminalzeichen B auf einer rechten Seite auftritt. Daher ıst follow(B) abzulesen als 
et 1 }. Somit ist first(B) N follow(B) = ©. 


Damit ist G eine LL(1)-Grammatik. Infolgedessen ist natürlıch L(G) eine LL(1)-Sprache. 
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6.4.4. Aufbau eines Parsers für eine LL(1)-Grammatik 


Bevor wir uns der etwas umfangreicheren Modellsprache PL/O (gemäß [Wirth2]) zuwenden, 
wollen wir elementare Überlegungen anstellen, wie ein Parser, eine Analyseprozedur, 
arbeiten könnte. Wir bearbeiten dıe Problematik hier konkret mit den Programmiersprachen 
Pascal und C. Aus Gründen des hierarchischen Prozedurkonzepts von Pascal besprechen wir 
im Folgenden diese Version; dıe C-Varıante des Parsers wırd anschließend gezeigt. 


Sinnvoll ıst zunächst eine Prozedur, die wır GeiSym nennen wollen, dıe aus dem 
Eingabestrom (Quelltext) das jeweils nächste Symbol ın einer Variablen namens sym 
bereitstellt. Sıe realisiert die lexikalische Analysephase. 


Aus der Quelltext-Sequenz ifa >= b then b := a entsteht (beispielsweise ın der Notation des 
in Abschnitt 4.5. ausführlich vorgestellten Parserprogramms) die Symbolfolge ifsym ident 
geq ident thensym ident becomes ident. Dabei sind ifsym und thensym Namen für die 
Symbole, die ın Pascal durch dıe Schlüsselwörter if und /hen ausgedrückt werden. ident steht 
für Identifier (Bezeichner), geg und becomes sınd Bezeichnungen für die Symbole >= 
(greater or equal) bzw. := (Zuweisungsoperator). 


Darüber hınaus brauchen wır eine Symboltabelle, die dıe zu einem Symbol zusätzlich 
notwendigen Informationen speichert, z. B. zum Symbol ident für einen Bezeichner dessen 
Namen und Datentyp oder auch ggf. dessen aktuellen Wert. 


Desweiteren soll eine (zunächst spartanısche) Fehlerbehandlungsprozedur Frror 
bereitgestellt werden. Für unsere Zwecke soll eine kurze Fehlermeldung auf dem Bildschirm 
genügen und die Arbeit des Parsers sofort nach dem ersten aufgetretenen Fehler beendet 
werden. 


Auf dıe Konstruktion des abstrakten Baumes für weitere Phasen wird hıer verzichtet und die 
ım Ansatz ın der Variablen srable (vgl. den Quelltext ın Abschnitt 4.5.1) skızzıerte 
Symboltabelle wird nıcht aufbewahrt. 


Der grundsätzliche Aufbau des Parsers kann dann einigermaßen direkt von der Darstellung 
der Grammatık ın Backus-Naur-Form oder als Syntaxdıagramm abgeschrieben werden (vgl. 
auch Abschnitt 2.1.10.). 


Aus dem Syntaxdiagramm für eine Alternative ("A oder B") entsteht eine geschachtelte 
ıf-Struktur (oder eine entsprechende case-/switch-Struktur): 


if sym in first(A) then 
ProcedureA 

else if sym in first(B) then 
ProcedureB 

else 
Error 


Dabei sind ProcedureA und ProcedureB natürlich die entsprechenden Erkennungs- 
prozeduren für dıe Nichtterminalzeichen A und B. (Die Verallgemeinerung auf eine 
mehrfache Alternative ıst naheliegend.) 
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Das Syntaxdıagramm für eine Aufeinanderfolge (Konkatenation) wırd einfach umgesetzt ın 


die Form 
ProcedureA; 
A 
ProcedureB; 


Dabei ist folgendes zu beachten: da eine eventuelle Fehlererkennung, und damit verbunden 
eine Fehlermeldung, nicht von der aufrufenden Prozedur veranlaßt wırd, sondern ın die 
Prozeduren A respektive B verlagert wird, geht zwangsläufig die Information verloren, ın 
welchem Kontext A bzw. B aufgerufen wurde, also Information, die für dıe praktische 
Fehlersuche hilfreich sein kann. 


Die Wiederholungsstrukturen (Iterationen) können entsprechend umgesetzt werden! 
O- oder n-mal A wird zu 


while sym in first(A) do 
ProcedureA x 
und 1- oder n-mal A wird zu 


ProcedureA; 


while sym in first(A) do a 
ProcedureA 


(In der Praxıs kann dies eleganter durch eine 
fußgesteuerte Schleife ausgedrückt werden.) 


Der Speziıalfall der Alternative, dıe Option ("nichts oder A"), kann umgesetzt werden ın die 
Form 


if sym in first(A) then 


ProcedureA 


[B 


Zu beachten ıst hier lediglich, dass keine else-Error-Behandlung folgen kann, da das 
Syntaxelement A nicht vorkommen muss! 
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Schließlich wırd ein "rundes" Syntaxdıagrammsymbol, das "für sich selbst" steht, 
entsprechend umgesetzt: 
if sym=x then zu; 
GetSym {nächstes Symbol holen } 
else 


Error 


6.4.4.1. Beispiel (XParser) 


Sehen wir uns dıe obigen Erläuterungen konkret umgesetzt anhand einer kleinen Sprache 
("Ausdrücke mit X") an. In Backus-Naur-Form seı die erzeugende Grammatik G := (N,T,S,P) 
vorgegeben wie folgt: N:={S,A},T :={x,+,(,) } die Produktionsregeln P seien 
S:=A,A:=xlA{+tA}. 


XPARSER Kleiner Parser für Klammerausdrücke mit "x" und "+". 


const Alphabet = [ 'x', '(!, ')', "+"; 
First, ol St, #6 7; 
type symbol = char; 
var sym : symbol; { letztes gelesenes Zeichen; hier ist 


speziell Symbol=Zeichen 


procedure Error; 
begin 
writeln('Fehler!') 


end; { Error } 
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procedure GetSym; 
begin 
if eoln(input) then 
begin 
readln; 
writeln 
end; { if eoln } 
read (sym) ; 
write (sym) { Listing produzieren |} 


end; { GetSym } 


procedure A; 
begin 
if sym='x' then 
GetSym 
else if sym='(' then 
begin 
GetSym; 
A; 
while sym='+' do 
begin 
GetSym; 
A 
end; { while sym='+' } 
if sym=')' then 
GetSym 
else 
Error { keine schließende Klammer gefunden } 
end { sym='(' } 


else 
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Error { weder 'x' noch öffnende Klammer gefunden } 


end; {A |} 
begin {S } 
A; 


if sym in Alphabet then 


{ Jedes andere Zeichen wird als |} 


Error; { Abschluss akzeptiert. } 


end; {S } 


begin 


writeln; 


writeln('XParser: Eine Erkennungsprozedur für S::=A, A::=x| (A{+A}) '); 


write('> '); 
GetSym; 
S 


end. { XParser |} 


Und hier die entsprechende XParser-Varıante ın der Programmiersprache (ANSI-)C, die an 


einzelnen Stellen vom Vorgehen der Pascal-Version abweicht, indem sıe insbesondere einen 


deutlichen Fehlertext ausgibt. (Vgl. auch die Kommentierungen ım folgenden Quelltext). 


XPARSER Kleiner Parser für Klammerausdrücke mit "x" und "+". 


#include <stdio.h> 


#define TRUE (1==]1) 


#define FALSE (0==]1) 
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typedef int boolean; 

typedef char symbol; 

enum ERRORS { ERR_NO ERROR, /* kein Fehler aufgetreten */ 
ERR NO RIGHT _PAREN, /* keine schließende Klammer */ 
ERR NO X OR L _ PAREN,/* weder 'x' noch ' (' * 
ERR INVALID START, /* ungültiges Startsymbol */ 


ERR INVALID CHAR, /* unzulässiges Zeichen */ 


}; 


/* Die C-typische Array-Initialisierung wird hier eingesetzt */ 


/* zur ausführlicheren Ausgestaltung der Error-Routine. */ 
char *ErrorMsq[] = 
{ " [ok] " 


"[Keine schließende Klammer gefunden.]", 
"[Weder 'x' noch Öffnende Klammer gefunden.]", 
"[Fehlerhaftes Startsymbol gefunden.]", 


"[Inkorrektes Symbol als Abschluss gefunden.]" 
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symbol Alphabet [] = { 'x', '(', ')', "+", NULL }; 
symbol FirstAll = { 'x', '(', NULL }; /* First-Menge von A */ 
symbol Sym; /* letztes gelesenes Zeichen/Symbol */ 
int ErrorCode = 0, 

Symkread = 0; 
[| *---------------------- 2-22 - Prototypen ---*/ 


void Error (int); 

boolean IsIn (symbol, symbol *); 
void GetSym(void) ; 

void A(void) ; 


void S (void); 
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void main (void) 
{ 
printf ( 
"\nxparser: Eine Erkennungsprozedur für die Grammatik S::=A," 
INNERES A::=x| (Af+A}) ; Eingabe mit [Return] beenden.\n"); 
Prineftr N): 
GetSym(); 
Sauer 
if (ErrorCode!=0) { 
int 1; /* Markierung der mutmaßlichen Fehlerstelle */ 
for (i=0; i<=SymRead; i++) 
putchar(' '); 
putchar ('*"'); 
} 
printf ("\n%d Symbol (e) gelesen; ErrorCode: %d 3s\n", 
SymRead, ErrorCode, ErrorMsg [ErrorCode] ) ; 


} /* end main */ 


void Error (int errcode) 


if (ErrorCode==0) 
ErrorCode=serrcode; 
/* 1.Fehler protokollieren! */ 


} /* end Error */ 
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boolean IsIn (symbol s, symbol *allowed) 


while (*allowed) 
if (s == *allowed++) 
return (TRUE); 
return (FALSE) ; 


\ /* end IsIn */ 


void GetSym(void) 


Sym=getchar (); 


if (ErrorCode==0 && Sym!='\n') 


SymRead++; 
}\ /* end GetSym */ 


void A(void) 


else if (Sym=='(') 


while (Sym=='+!') 
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Error (ERR NO RIGHT PAREN); 


} else 


Error (ERR NO X OR L PAREN); 


} /* end A */ 


if (IsIn(Sym,FirstA)) 
Al); 


else 


Error (ERR_ INVALID START); 


if (IsIn(Sym, Alphabet) ) 


Error (ERR_INVALID_ CHAR); 


Y /* end S */ 


/*-end of file xparser.c 
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6.4.5. Ein Parser für die Modellsprache PL/O 


In diesem Abschnitt wollen wır die vorgestellten Prinzipien anwenden auf einen Parser für 
dıe von Wirth eingeführte Modellsprache P//0. Nachfolgend sind die (auf [Wiırth2] 
basıerenden) Syntaxdıagramme für PL/O abgebildet. 


rogram 
z © 


ut ea 


u 


constdecl 
vardecl a a 
procdecl 

PROCEDURE block 
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statement 


(ident ) expression 


condition 
m condition 


condition 


expression 


expression 
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EXPrTESSION 


factor 


Die hier vorgestellte Sprache PL/O kann ım Prinzip als kleine Untermenge von Pascal 
verstanden werden. Sıe enthält das Prozedur-Konzept mit seinen geschachtelten 
Deklarationen und einer leicht varııerten Aufrufsyntax (Schlüsselwort call) sowie der 
Lokalität von Variablen. Als Datentyp ıst der Einfachheit halber nur der (nıcht namentlich 
benannte) Ganzzahltyp ınteger realısıert. In der hier vorliegenden Fassung enthält PL/O keine 
Eın- und Ausgaberoutinen, da Prozeduren ın PL/O keine Parameterlisten besitzen. 


Neben dem Pascal-Quellcode für den PL/O-Parser werden ım weiteren auch noch das 
Blockdiagramm des Programms sowie eine Parservarıiante in ANSI-C vorgestellt. 


- 163 - 


6.4.5.1. Quelltext des PL/O-Parsers (Pascal-Version) 


Die Syntaxdiagramme für PL/O lassen sich direkt umsetzen ın ein Compiler- bzw. 
Parser-Programm. Bei diesem handelt es sich um eine Modifikation des von Wirth 
vorgeschlagenen Programms aus seinem Buch C’ompilerbau [Wirth2]. 


program PLOParser (input, output); 


EEE E02 2 120202 12 2 202 12 21202 2 20202 2 21202 2 21202 2 21202 2121202 2 2 202 22 202 2 2 202 2 2 202 2 2 22 2 2 22 2 222,2 
(** **) 
(** PLO.PAS - Standard-Pascal-Version. xx) 
[** Parser für PL/O. xx) 
(** **) 
EaBaEa CE 02 32 12 02 02 32 32 32 32 32 12 02 32 32 2 0202 32 20202 12 2 0202 12 2 202 12 20202 12 20202 12 21202 2 2202 2 2202 2 2 202 2 2 22 2 2 22,2 


{ Deklarationen für den PL/O Parser } 
——————— ee 
const 
NORW = 11; { "number of reserved words" } 
TXMAX = 100; { Größe der Bezeichner-Tabelle } 
NMAX = 14; { maximale Anzahl von Ziffern in } 
{ integer-Zahlen } 
AL = 10; { Akzeptierte Länge von Bezeichnern |} 
CHSETSIZE = 256; { ASCII Zeichensatz } 
LINELEN =: 80: 
LETTERS = ta EZ Ar ZT: 
ALPHANUMS = ['a'..'z','A'..'2','0'..'9']; 
NUMBERS = PO, 
type 
symbol = ( nul, ident, number, plus, minus, times, slash, 


oddsym, eql, neq, 1ss, leq, gtr, geq, lparen, 


rparen, comma, semicolon, period, becomes, 
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alfa 


objekt 


vVr 


num, 


beginsym, endsym, ifsym, thensym, whilesym, 
dosym, callsym, constsym, varsym, procsym ) ; 
packed array [1..AL] of char; 


( constant, variable, proc ); 


char; { jeweils letzter gelesener character 
: symbol; { letztes gelesenes Symbol 
alfa; { letzter gelesener Bezeichner (identifier) 
{ letzte gelesene Zahl 
{ "character count" 
{ "line length" 
: integer;{ Erweiterung: Zeilennummer (fortlaufend) 


: packed array[1..LINELEN] of char; 


: alfa; 


: array [1..NORW] of alfa; 


: array [1..NORW] of symbol; 


: array [char] of symbol; 


: array [0..TXMAX] of 


record 
name: alfa; 
kind: objekt 


end; 
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procedure Error (n: integer); { - erste Fehlerprozedur - |} 
begin 
wrieelne: Wiee,,n2) { Fehlermarkierung im Quell- } 


{ text mit character count |} 
writeln('Fehler gefunden in Zeile ',zz:1l,'.'); 


case n of { Einige Fehlernummern werden hier exemplarisch aufgeführt } 


2 : writeln('Zahl erwartet!'); 
3 : writeln('Gleichheitszeichen erwartet!'); 
4 : writeln('Bezeichner erwartet!'); 


9 : writeln('Punkt erwartet!'); 
11 : writeln('Nicht deklarierter Bezeichner: ',id); 
31: writeln('Zahlbereichsüberschreitung! (MAXINT=',MAXINT:1,')'); 
{ ... hier darf noch beliebig ergänzt werden ... |} 
99 : writeln('Programm unvollständig!') 
else writeln 
end; {case} 
halt (1) 


end; {Error} 
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procedure GetSym; 
var i,jJ,K,neuwert : integer; 


gefunden: boolean; 


procedure GetCh; 
var i: integer; 
begin 
if cc = 11 then 
begin 
if eof (input) then 
Error (99); 
ZZ := ZZ + 1; 
4: 3:0: 
ce = 0; 
write(' '); 
for i:=1 to LINELEN do 
linelij)z=" %; 
while not eoln(input) and (11 < LINELEN-1) do 
begin 
1, = 112%; 
read (ch); 
write (ch); 
line[ll] := ch 
end; 
writeln; 
1 se 12.44: 
Iınell1ljset 


readln { read(line[l1]) } 


end; 
ee Zee 
ch := line[cc]; 
end; {Getch} 
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begin {GetSym} 
while ch=' ' do 
Getch; { Leerzeichen werden überlesen |} 
if ch in LETTERS then 
begin {---identifier oder reserviertes Wort---} 
K- 3=.:03 
for i:=1 to 10 do 
Talr), ze 
repeat 
if k < AL then 
begin 
k: ze:ik#T: 
id[k] := ch 
end; 
GetCh 
until not (ch in ALPHANUMS) ; {--Ende des Identifiers/Wortes-- } 
Tee; 
repeat { Suchen / Prüfen: } 
gefunden := id=word[i] ; { Ist es ein reserviertes Wort? | 
if not gefunden then 
i:=i+l 
until gefunden or (i > NORW); 
if gefunden then 
sym := wsym[i] 
else 
sym := ident 
end {ch in LETTERS) {---identifier oder reserviertes Wort--)} 
else if ch in NUMBERS then 


begin {---Zahlen---)} 
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repeat 


neuwert := ord(ch) -ord('0'); 
if num <= (MAXINT - neuwert) div 10 then 
num := 10*num + neuwert 
else 
Error (31); 
k := k+1l; 
GetCh 
until not (ch in ['0'..'9']) or (k > NMAX); 
if k > MAX then 
Error (30) 
end {ch in NUMBERS) 
else if ch=':' then { ab hier: 
begin 
GetCh; 
if ch='=' then 
begin 
sym := becomes; 
GetCh 
end 
else 
sym := nul 
end {ch=':'} 
else if ch='<' then 
begin 
GetCh; 
if ch='=' then 
begin 
sym := leq; 
GetCh 
end 
else 
sym := 1ss 
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{---Zahlen---)} 


Sonderzeichen } 


end {ch='<'} 


else if ch='>' then 


begin 
Sym := geg; 
GetCh 
end 
else 
sym := gtr 


sym := ssymich] ; Hiermit wird einem falschen Zeichen das Symbol 


{ 
{ NUL zugewiesen, der eigentlich lexikalische 
{ Fehler somit in die syntaktische Phase 

{ verlagert. 

GetCh 

end 


end; {GetSym} 


procedure Block (tx: integer); [ ----------2222222=- Block z=8# 
procedure Enter (k: objekt); { Tabelleneintrag: var, 
begin { const und proc 


- 170 - 


De De DE u DE dl 


Er re el 


with table[tx] do 


begin 

name := id; 
kind :=k 
end {with} 


end; {Enter} 


function Position(id: alfa): integer; { Tabelleneintrag finden } 
var i: integer; 
begin 
table[0] .name := id; 
1. SE, EX 
while table[i]..name <> id do 
i := 1-1; 
Position := i { entweder Positionsnummer oder O=nicht gefunden |} 


end; {Position} 


procedure ConstDecl; 
begin 
if sym=-constsym then 
begin 
repeat 
GetSym; 
if sym-ident then 
begin 
GetSym; 
if sym=eql then 
begin 
GetSym; 
if sym=number then 
begin 


Enter (constant) ; 
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GetSym 
end 
else 
Error (2) 
end 
else 
Error (3) 
end 
else 
Error (4) 
until sym<>comma ; 
if sym=semicolon then 
GetSym 
else 
Error (5) 
end 


end; {ConstDecl} 


procedure VarDecl; 
begin 
if sym=varsym then 
begin 
repeat 
GetSym; 
if sym-ident then 


begin 


Enter (variable) ; 


GetSym 
end 
else 
Error (4) 
until sym<>comma ; 


if sym=semicolon then 
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GetSym 
else 

Error (5) 
end 


end; {VarDecl} 


procedure ProcDecl (var tx: integer); 
begin 
if sym=ident then 
begin 
Enter (proc); 
GetSym 
end 
else 
Error (4); 
if sym=semicolon then 
GetSym 
else 
Error (5); 
Block (tx) ; 
if sym=semicolon then 
GetSym 
else 
Error (5) 


end; {ProcDecl} 


procedure Statement; { Erkennungsprozedur für Anweisung 


var i: integer; 


procedure Expression; { für Ausdruck 


procedure Tem; { für Term 
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procedure Factor; { für Faktor } 
var i: integer; 
begin 
if sym=ident then 
begin 
i := Position (id); 
if i=0 then 
Error (11) { ident nicht gefunden! } 
else if table[i] .kind=proc then 
Error (21); 
GetSym 
end 
else if sym=number then 
GetSym 
else if sym=-lparen then 
begin 
GetSym; 
Expression; 
if sym=rparen then 
GetSym 
else 
Error (22) 
end 
else Error (23) 


end; {Factor} 


begin {---Term---} { Erkennung von Term } 
Factor; 
while sym in [times,slash] do 

begin 

GetSym; 

Factor 


end 
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end; {Term} 


begin {---Expression---} { Erkennung von Ausdruck} 
if sym in [plus,minus] then 
begin 
GetSym; 
Term 
end 
else 
Term; 
while sym in [plus,minus] do 
begin 
GetSym; 
Term 
end 


end; {Expression} 


procedure Condition; { Erkennen von Bedingung} 
begin 
if sym=-oddsym then 
begin 
GetSym; 
Expression 
end 
else 
begin 
Expression; 
if sym in [eql,neq,1lss,leq,gtr,geq]) then 
begin 
GetSym; 
Expression 
end 


else 


=173.= 


Error (20) 
end 
end; {Condition} 
begin {---Statement---)} { Erkennen von Anweisung } 
if sym=ident then 
begin 
i := Position (id); 
if i=0 then 
Error (11) 
else if table[i]..kind <> variable then 
Error(12); 
GetSym; 
if sym=becomes then 
GetSym 
else 
Error (13); 
Expression 
end 
else if sym=callsym then 
begin 
GetSym; 
if sym <> ident then 
Error (14) 
else 
begin 
i := Position(id); 
if i=0 then 
Error (11) 
else if table[i] .kind <> proc then 
Error (15); 
GetSym 
end 


end 
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else if sym=beginsym then 
begin 
GetSym; 
Statement; 
while sym=semicolon do 
begin 
GetSym; 
Statement 
end; 
if sym=endsym then 
GetSym 
else 
Error (17) 
end 
else if sym-ifsym then 
begin 
GetSym; 


Condition; 


if sym=thensym then 
GetSym 

else 
Error (16); 

Statement 

end 

else if sym=whilesym then 

begin 

GetSym; 

Condition; 

if sym=dosym then 
GetSym 


else 


3177 € 


Error (18); 
Statement 
end 


end; {Statement} 


begin {Block} 
ConstDecl; 
VarDecl; 
while sym=procsym do 
begin 
GetSym; 
ProcDecl (tx) 
end; 
Statement 


end; {Block} 
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procedure Init; 
var initch: char; 
begin 


{ -- Initialisierung des Sondersymbol-Arrays 


for initch := chr(0) to chr (CHSETSIZE-1) do 


ssym[initch] := nul; 


ssym['+'] := plus; ssym['-']:= minus; 


ssym['*'] := times; ssym['/']:= slash; 
ssym['('] := lparen; ssym[')']:= rparen; 
ssym['='] := eql; ssym[',']:= comma; 


ssym['.'] := period; ssym['#']:= negqg; 


ssymL."<'"] ze: 188; ssynl?>"]:=.Str; 

ssym[';'] := semicolon; 

{ -- Initialisierung der beiden Schlüsselwort-Arrays -------------- 
word|[ 1] 'begin ne word[ 2] := 'call : 

word|[ 3] 'const ": word[ 4] := 'do 1: 

word[ 5] 'end u word[ 6] := 'if 2; 

word|[ 7] 'odd F word[ 8] := 'procedure '; 

word[ 9] 'then 1 word [10] := 'var "5 

word [11] 'while Ri 

wsym[ 1] beginsym; wsym[ 2] := callsym; 

wsym[ 3] constsym; wsym[ 4] := dosym; 

wsym[ 5] endsym; wsym[ 6] := ifsym; 

wsym[ 7] oddsym; wsym[ 8] := procsym; 

wsym[ 9] thensym; wsym[10] := varsym; 

wsym[11] whilesym; 

{ -- Initialisierung weiterer Hilfsvariablen ---------------------- 
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ee wi 


11..3=70° 
eh ea. NEE 
22:3 0, 


end; {Init} 
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begin { main } 
Wrıtein fessasresss ne ee a dei are seine ie 


writeln('PL/O Syntax Analyser [nach Professor Niklaus Wirth] '); 


WELLeln Verse EEE Een Deere one > 
writeln; 

Tritt; { Initialisierung der globalen Variablen |} 
GetSym; { Behandlung des Syntaxdiagrams "program" |} 
Block (0); { Aufruf von Block mit Tabellenindex tx=0 } 


if sym = period then 
writeln('Syntaxanalyse ok.') 
else 


Error (9) 


end. 


ELLE 1 2. 2, 2, 2, 2,2) 


[#*%* End of file plO pas ELLE 2 u 2 2, 2,2 
EaBAEaE CE02 32 12 12 02 32 12 12 32 32 12 02 02 32 2 202 12 21202 12 2 202 12 20202 2 20202 12 21202 2 21202 2 2202 2 21202 2 2 22 2 2 2 2 2 2 22,2 


Zu diesem Parser-Programm hier noch ein beispielhafter Programmlauf mit einem kleinen 
fehlerhaften PL/O-Programm. 


PL/0O Syntax Analyser [nach Professor Niklaus Wirth] 
const MAX=10; 
var i,J,K; 
begin 
i:=2*MAX; 
j]:=i+k/m; 


“EL 
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Fehler gefunden in Zeile 5. 


Nicht deklarierter Bezeichner: m 
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6.4.5.2. Quelltext des PL/O-Parsers (C-Version) 


Hier nun die angekündigte, ın ANSI-C formulierte Parser-Version, dıe bewußt ın einzelnen 
Detailformulierungen von der Pascal-Varıante abweicht. Insbesondere werden die teilweise 
(gegenüber Pascal) komfortableren Möglichkeiten von C genutzt. Auf der anderen Seite 
musste auf dıe Blockstruktur der Prozeduren (Funktionen) wegen der Einschränkung von C 


verzichtet werden. 


/* 
* plO.c 


* Die Ablaufphilosophie ist hier C-typisch: Im Falle eines Fehlers 


* wird die terminierende Fehlerroutine aufgerufen. Dadurch entfällt 


* jeweils der else-Zweig. 


_ 


[FRKR Headerdateien EEE E22 12 2 2 2 02 2 12 1202 2 2 12 12 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2.2 2 2 2.2 2 2 2.2. 2.2. 2.207 


#include <ctype.h> 
#include <limits.h> 
#include <stdio.h> 
#include <stdlib.h> 


#include <string.h> 


J[FRK Defines RR / 


#define NORW El /* 
#define TXMAX 100 /* 
#define NMAX 14 /* 

/* 
#define AL 10 /* 


#define CHSETSIZE 256 /* 


#define LINELEN 80 /* 


#define CR 0x0D /* 


#define LF 0Xx0A /* 


"number of reserved words */ 
Groesse der Bezeichner-Tabelle */ 
maximale Anzahl von Ziffern in */ 
integer-Literalen */ 
akzeptierte Länge von Bezeichnern*/ 
8-Bit-ASCII-Zeichensatz (Groesse) */ 


Zeilenlaenge des Eingabestromes */ 


CarriageReturn */ 


LineFeed 2: 
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[HR%R Typ-Deklarationen er / 


typedef enum symbol 


NUL, IDENT, NUMBER, PLUS, MINUS, TIMES, SLASH, ODD, 
EQL, NEQ, LSS, LEO, GTR, GEQ, 

LPAREN, RPAREN, COMMA, SEMICOLON, PERIOD, BECOMES, 
BEGIN, END, IF, THEN, WHILE, DO, CALL, 


CONSTANT, VARIABLE, PROCEDURE 


SYMBOL; 


typedef char ALFA[AL+1]; /* +1 wegen ASCII-0 als String-Ende-Marke */ 


typedef enum object 


CONST, VAR, PROC 


OBJECT; 


typedef struct tableentry 


ALFA name; 
OBJECT kind; 


TABLEENTRY; 


typedef TABLEENTRY TABLE [TXMAX+1] ; 
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[FR% Prototypen ee / 


void Error (int); 
void GetCh (void); 
void GetSym(void); 
void Block (void); 
void Enter (OBJECT) ; 
int Position (ALFA); 
void ConstDecl (void) ; 
void VarDecl (void); 
void ProcDecl (void); 
void Statement (void) ; 
void Expression (void) ; 
void Term(void); 
void Factor (void) ; 


void Condition (void) ; 


/*** Deklarationen der globalen Variablen *+rrkrx xx kck/ 


char ch='!' '; 
SYMBOL sym; 
ALFA id; 
int num, 
cc=0, 
11=0, 
tx=0, 
lineno=0; 
char line [LINELEN] ; 


ALFA word [NORW] = 


"begin". "call", 


"Oda” .. "PEOeSdure", 


/* letztes gelesenes Zeichen 

/* letztes gelesenes Symbol 

/* letzter gelesener Bezeichner 

/* letzte gelesene Zahl (num. Wert) 
/* "character count" 

/* "line length" 

/* Tabellenindex (siehe Var. table) 
/* Zeilennummer des Quelltextes 

/* Buffer fuer Eingabezeile 


/* Liste der Bezeichner 


" const " ; "do" : " end" ; " if " ö 


"chen", "var", "while" 
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._ 
= 
&, 
u, 
2, 
_ 
7, 
o. 
7 
a2 


SYMBOL wsym[NORW] = /* Liste der entsprechenden Symbole */ 


BEGIN, CALL, CONSTANT, DO, END, IF, 
ODD, PROCEDURE, THEN, VARIABLE, WHILE 


}. 


ssym[CHSETSIZE]={ NUL };/* Liste der Sondersymbole */ 


TABLE table; /* Symboltabelle */ 


[FR%R Hauptprogramm PL/O0-Parser EEE 2202 2 20202 2 20202 2 2202 2 2 202 2 2 22 2 2 2 2.2 2.22.27 


int main (void) 


int i; 


/* Initialisierung der globalen Variablen ssym[]. */ 


/* Die Arrays word[] und wsym[] wurden schon bei der Deklaration*/ 


/* initialisiert. */ 
ssym['+']=PLUS; ssym['-']=MINUS; ssym['*']-TIMES; 
ssym['/']=SLASH; ssym[' (']=LPAREN; ssym[') ']=RPAREN; 
ssym['=']=EQL; ssym[', ']=COMMA; ssym['.']=PERIOD; 
ssym['#']=NEO; ssym['<']=LSS; ssym['>']=GTR; 


ssym['; ']=SEMICOLON; 


if (sym!=PERIOD) 
Error (9); 
printf ("Syntaxanalyse ok.\n"); 


return EXIT SUCCESS; 


} /* end main */ 
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/*** Error: Fehlermeldung und Programmausstieg esse er / 
void Error (int errmo) 
{ 
int i; 
print£ ("x*«"), 
for (i=0; i<cc; i++) 
putchar(' '); 
printf (""\n*** Fehler #%d aufgetreten in Zeile " 
"<d!\n",ermo,lineno) ; 
printf ("Syntaxanalyse abgebrochen.\n"); 
exit (EXIT_FAILURE); 


} /* end Error */ 


/*** GetCh: Aktuelles Zeichen bereitstellen **+*rrxxkxxkarkkrkkackkrrk/ 
void GetCh (void) 


if (cc==11) /* d. h. alte Zeile verbraucht, neue Zeile holen */ 


if (feof (stdin) ) 
printf ("*** Fehler: Programm unvollständig!\n"); 
exit (EXIT _FAILURE); 
} 
cc=0; 
printf ("%3d: ",++lineno) ; 
fgets (line , LINELEN-1,stdin); 
printf ("%s", line); 
ll=strlen (line); 
ch=line [cc++] ; 
if (ch==CR || ch==LF) /* Umwandlung von CarriageReturn und */ 
ch='! '; /* LineFeed in Blanks */ 


} /* end Getch */ 
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/*** GetSym: Aktuelles Symbol bereitstellen *+rkrk tk ker / 


void GetSym(void) 


while (ch==' ') 
Getch (); 


if (isalpha(ch) ) 


int i=0; 
do 
{ 
if (i < AL) 
idli++]=ch; 
GetCh (); 


} while (isalnum(ch)); 


ia]; 


for (i=0; i<NORW; i++) 


/* 


/* 


/* 


/* 


/* 


Leerzeichen werden ueberlesen */ 
Buchstaben =; 
Bezeichner a zusammenbauen */ 
Stringende markieren */ 
Suche: ist id ein Schluesselwort? */ 


if (stremp (id,word[i])==0) 


{ 
sym=-wsym[i]; 


return; 


sym=IDENT;; 


} /* end Buchstaben */ 
else if (isdigit (ch) ) 
{ 

int. 2-0; 

num=0; 


sym=NUMBER ; 


/* 
/* 
/* 
/* 
/* 


zifferzeichen */ 
Der numerische Wert des Zahl- */ 
literals wird zwar emittelt u. in*/ 


der Variablen num gespeichert; er */ 


wird jedoch nicht weiter verwendet*/ 
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do 


int neuwert; 


if (1>NMAX) /* Overflow? NMAX=max. Stellenanzahl */ 
Error (30); 
neuwert = ch - '0'; 


if (num <= (INT _ MAX - neuwert) / 10) 


num = 10*num + neuwert; 
else 

Error (31); 
Ii+t+; 
Getch (); 


} while (isdigit (ch)); 
} /* end Zifferzeichen */ 
else /* ab hier: Sonderzeichen */ 


switch (ch) 


case ':!': GetCh(); 


sym=BECOMES;; 
GetCch (); 

} 

else 
Sym-NUL; 


break; 
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case '<!: Getch(); 


else 
sym=LSS; 
break; 


case '>!: GetCh (); 


else 
sym-GTR; 
break; 
default: sym=ssym[ch] ;/* Hiermit wird einem falschen */ 
/* Zeichen das Symbol NUL zuge-*/ 
/* wiesen, der eigentlich lexi-*/ 
/* kalische Fehler somit in die*/ 
/* syntaktische Phase verlagert*/ 
Getch (); 
break; 
} /* end switch */ 
} /* end Sonderzeichen */ 


} /* end GetSym */ 
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/*** Block: Abarbeitung des Syntaxdiagramms Block rk rk rk rk / 
void Block (void) 
{ 
int prevtx=tx; /* alten Tabellenindex sichern */ 
/* Vergleichen Sie dieses Vorgehen mit */ 
/* der Pascal-Implementation in 4.5.1! */ 
ConstDecl (); 
VarDecl (); 
while (sym==PROCEDURE) 
{ 
GetSym(); 
ProcbDecl (); 


Statement (); 


tx=prevtx; /* Tabellenindex tx zuruecksetzen */ 


} /* end Block */ 


/*** Enter: Eintragung in die Tabelle table vornehmen *rttrkrkxktkxxx / 
void Enter (OBJECT obj) /* Tabelleneintrag: CONST, VAR, PROC  */ 
{ 

UX++; 

strcpy (table [tx] .name,id); 

table [tx] .kind=obj ; 


} /* end Enter */ 


/*** Position: Gueltigkeit eines Bezeichners ueberpruefen **+*xxkxxxx*/ 


int Position (ALFA id) 


{ 
int i=tx; 


strcpy (table [0] .name,id); 


=.191 = 


while (strcemp (table [i] .name, id) !=0) 
jee; 
return (i); /* entweder Positionsnummer oder 0 fuer*/ 


} /* end Position */ /* nicht gefunden */ 


/*** ConstDecl: Abarbeitung der entsprechenden Syntax *rrkkkkkkkkkkx / 
void ConstDecl (void) 


if (sym==CONSTANT) 
{ 
do { 
GetSym(); 
if (sym!=IDENT) 
Error (4); 
GetSym(); 
if (sym!=EQL) 
Error (3); 
GetSym(); 
if (sym!=NUMBER) 
Error(2); 
Enter (CONST); 
GetSym(); 
} while (sym==COMMA) ; 
if (sym!=SEMICOLON) 
Errör (5); 
GetSym(); 


} /* end ConstDecl */ 


/*** VarDecl: Abarbeitung der entsprechenden Syntax **trkxkkkkkkkkkrk/ 


void VarDecl (void) 
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if (sym=-=VARIABLE) 
{ 
do { 
GetSym(); 
if (sym!=IDENT) 
Error (4); 
Enter (VAR); 
GetSym(); 
} while (sym==COMMA) ; 
if (sym!=SEMICOLON) 
Error (5); 
GetSym(); 


} /* end VarDecl */ 


/*** ProcDecl: Abarbeitung der entsprechenden Syntax *rrkkkkkxkkkkkx / 
void ProcDecl (void) 
{ 
if (sym!=IDENT) 
Error (4); 
Enter (PROC); 
GetSym(); 
if (sym!=SEMICOLON) 
Error (5); 
GetSym(); 
Block (); 
if (sym!=SEMICOLON) 
Error(5); 
GetSym(); 


} /* end ProcDecl */ 


193 


/*** Statement: Abarbeitung des Syntaxdiagramms *+kkrkkkkkkkkkrkkrkk/ 
void Statement (void) 
{ 
int i; 
switch (sym) 
{ 
case IDENT: 
i=Position (id); 
it (i==0) 
Error (11); 
if (table [i] .kind!=VAR) 
Error (12); 
GetSym(); 
if (sym!=BECOMES) 
Error (13); 
GetSym(); 
Expression (); 
break; 
case CALL: 
GetSym(); 
if (sym!=IDENT) 
Error (14); 
i=Position (id); 
If’ 11-0) 
Error (11); 
if (table[i] .kind!=PROC) 
Error (15); 
GetSym(); 


break; 
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case BEGIN: 
GetSym(); 
Statement (); 
while (sym==SEMICOLON) 
{ 
GetSym(); 
Statement (); 
} 
if (sym!=END) 
Error (17); 
GetSym(); 
break; 
case IF: 
GetSym(); 
Condition (); 
if (sym!=THEN) 
Error (16); 
GetSym(); 
Statement (); 
break; 
case WHILE: 
GetSym(); 
Condition (); 
if (sym!=DO) 
Error (18); 
GetSym(); 
Statement (); 
break; 
default: /* keine Fehlermeldung, da leeres 
break; /* Statement erlaubt ist! 
} /* end switch */ 


} /* end Statement */ 
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/*** Expression: Abarbeitung des Syntaxdiagramms Krrrkr rk kr / 


void Expression (void) 


if (sym=-=PLUS || sym==MINUS) 
GetSym(); 
Tem(); 


while (sym==PLUS || sym==MINUS) 


GetSym(); 


Tem(); 


} /* end Expression */ 


/*** Term: Abarbeitung des Syntaxdiagramms Krrrrr rk / 


void Term(void) 


Factor ();; 


while (sym==TIMES || sym==SLASH) 


GetSym(); 


Factor ();; 


\ /* end Term */ 
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/*** Factor: Abarbeitung des Syntaxdiagramms esse / 


void Factor (void) 


i=Position (id); 
if-(i==0) 
Error (11); /* Identifier nicht gefunden */ 
if (table [i] .kind==PROC) 
Error (21); /* Prozeduren nicht in Factor! */ 
GetSym(); 
} 
else if (sym==NUMBER) 
GetSym(); 
else if (sym==LPAREN) 
{ 
GetSym(); 
Expression (); 
if (sym!=RPAREN) 
Error\22):; 
GetSym(); 
} 
else 
Error (23); 


} /* end Factor */ 
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/*** Condition: Abarbeitung des Syntaxdiagramms *rrkrkkkkkkkkkkkkeek/ 


void Condition (void) 


{ 
if (sym==ODD) 
{ 
GetSym(); 
Expression (); 
} 
else 
{ 
Expression (); 
if (sym>=EQL && sym<=GEO) /* Vergleichsoperatoren */ 
{ 
GetSym(); 
Expression (); 
} 
else 
Error (20); 
} 


} /* end Condition */ 


NEN ar / 
[RK End of fıle plO @ EEE E22 02 2 2 2 12 2 12 22 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 22 2 2.2 2 2 2.2. 2 2. 2.207 


NER ar / 


Für den Rahmen unserer Vorlesung soll es hiermit genug des Einblicks ın dıe Theoretische 
Informatık und den Compilerbau sein. Wer sich jedoch für weitere Aspekte des 
Compilerbaus interessiert, der seı auf das Buch „Compilerbau” [Baeumle2] hingewiesen. 
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7. KURZE EINFÜHRUNG: RELATIONALE DATENBANKEN 


7.1. Theoretische Grundlagen relationaler Datenbanken 


Nachfolgend sollen einige Erläuterungen zum Themengebiet (Relationale) Datenbanken 
gegeben werden, dıe zum Teil den Büchern von Vetter (Aufbau betrieblicher Informations- 
systeme) [Vetter] und Vossen/Witt (SOL/DS-Handbuch) [Vossen] entnommen wurden oder 
zumindest daran angelehnt sind. Auch das Buch von Schwinn [Schwinn] zu Relationalen 
Datenbanken wurde für diesen Teil des Skriptums herangezogen. Im Rahmen der FHDW 
Studienordnung für das Wirtschaftsinformatik-Studium muss allerdings angemerkt werden, 
dass es eine eigenständige Vorlesung Datenbanken gibt, so dass an dieser Stelle nur einige 
Grundzüge behandelt werden. 


Einen (sowohl praktisch wıe auch von den Grundlagen her) interessanten Zugang zu den 
Beziehungen zwischen den Gebieten Datenbanken, Betriebswirtschaft und Software- 
Engineering liefert auch das Buch von Wolf Dietrich Nagl: Computertechnologie und 
Managementpraxis - Datenbanken und Objekte [Nagl]. 
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Bild: Ein einfacher Adreßdatenbestand ın einer Tabellenkalkulatıon und ın einem Datenbankprogramm 


Dabei sollen dıe ım folgenden angestellten theoretischen Betrachtungen auch Antwort auf die 
Frage geben, warum man nicht „einfach” seine Daten (z.B. Adressen von Lieferanten oder 
Bestellungen von Kunden) in einer Tabellenkalkulationssoftware verwaltet. 
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7.1.1. Grundlegende Datenbankmodelle 


Eine Datenbank ist eine Ansammlung miteinander in Beziehung stehender Daten, die allen 
Datenbankbenutzern als gemeinsame Basıs aktueller Informationen dient. 


Beı den Datenbankmodellen kann unterschieden werden, wıe die Identifikation einzelner 
Datenobjekte realisiert wird: in hierarchischen und Netzwerk-Datenbanken wird eine 
referentielle Suche (über ın irgendeiner Form codierte Speicherplatzadressen), ın relationalen 
Datenbanken eine assoziative (inhaltliche) Suche (nach konkreten Attrıbutwerten) 
durchgeführt. 


Eın relationales Datenbankmanagementsystem (DBMS) definiert sich im wesentlichen durch 
dıe folgenden Eigenschaften: 


°e Die gesamte Information einer relationalen Datenbank wird einheitlich durch Werte 
repräsentiert, die in Form von (zweidimensionalen) Tabellen dargestellt werden können. 


e Der Benutzer sıeht keine Verweiısstrukturen zwischen diesen Tabellen. 


e Es sınd (wenigstens) dıe Operationen zur Selektion (Auswahl) und Projektion 
(Ausschnitt) sowie zur Verbindung (Joın) von Tabellen(einträgen) definiert. 


(Zitiert nach [Ortmann], S. 22, bzw. [Codd].) 


Diese formale Definition beschreibt natürlich nur das Miınımum dessen, was heute für eın 
relationales Datenbankmanagementsystem üblıch ist. 


Während sıch die obige Definition mit ganz wenigen Kriterien an eın relationales DBMS 
begnügt, hat Codd 1990 eine Liste mit 333 (!) Kriterien aufgestellt, die ein Datenbanksystem 
erfüllen muss, um es (wissenschaftlich präzise) relational nennen zu dürfen. 


Ein Datenbankmanagementsystem muss jedenfalls stets zwei Grundfunktionen zur 
Verfügung stellen: die Strukturierung von Datenobjekten und die Repräsentation der 
(konkreten) Daten. 


Diese Grundfunktionen werden gut durch eine Tabellenstruktur umgesetzt: dıe Spalten einer 
solchen Tabelle liefern die 


. Struktur (nebenstehend 
EB Mitarbeiter : Tabelle ZJEIXE 2 die Felder ID” für 


I .1D | Name | Gehalt |=| eine fortlaufende eindeutige 
HM A muler | 4.850,00 DMLI| Nummer, „Name” für den 
| 2\Mayer | 3.984,55DM | aemamen emes Mita 
Zimmermann] 4.765,20 DM|zJ| manauicnen Brunobezig 
monatlichen Bruttobezüge 
Datensatz: el «|| ı + [su ]e*| von 3 | dieses Mitarbeiters. 


Über gemeinsame Felder 
können nun Beziehungen (Relationen) zwischen verschiedenen Tabellen aufgebaut werden; 
beispielsweise kann ın einer anderen Tabelle die hier gezeigte „ID” (Identifikationsnummer) 
dazu verwendet werden, ın einer Tabelle Mitarbeiteradresse die eindeutige Verbindung zu 
den hier gezeigten Mitarbeitern (und ıhren Gehältern) herzustellen. 
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Mathematisch wird nun mit den Grundoperationen Selektion und Projektion gearbeitet. Die 
Selektion wählt (null, eine oder mehrere) bestimmte Zeilen aus, betrifft also die 
Repräsentation der konkreten Daten. Die Projektion schneidet aus der Datenstruktur die 
gewünschten Informationen heraus. (Siehe hierzu das kurze „Mathematik-Refreshment” ın 
Abschnitt 7.1.6. auf Seite 208.) 


7.1.2. Anforderungen an Datenbanksysteme 


Eine relationale Datenbank ist eine Datenbank, ın der dıe Daten in Form von sogenannten 
Relationen (oder Tabellen) präsentiert werden. Der Zugriff erfolgt auf Basısrelationen, aus 
denen über entsprechende Verarbeitungsvorschriften gewünschte Ergebnisrelationen 
(Ergebnistabellen) erstellt werden. 


Datenbanksysteme werden eingesetzt zur EDV-gestützten Verwaltung großer Datenbestände. 
Bei den (von den diversen Betriebssystemen) gewohnten Dateisystemen besteht eine starre 
Zuordnung von Daten bzw. Dateien zu einzelnen, sıe verarbeitenden Programmen, 
Dateistrukturen müssen dem jeweiligen Anwendungsprogramm angepasst sein, gleiche oder 
ähnliche Daten sınd womöglich (in mehreren Varianten) ın verschiedenen Dateien physisch 
abgespeichert. 


Daraus resultieren eine hohe Redundanz (durch Mehrfachabspeicherung von Daten), die 
Gefahr von Inkonsistenz sowie Inflexibilität gegenüber veränderten Anforderungen der 
Anwender. Außerdem ıst heutzutage bei der Software-Erstellung die Einhaltung von 
Standards (z.B. hinsichtlich der verwendeten Datenformate) eine übliche Anforderung, die 
beı der Verwendung üblicher Dateisysteme nıcht automatisch erfüllt wırd. 


Beispiel: Redundanz und ıinkonsistente Daten treten sehr schnell auf. Die untenstehende 
Tabelle zeigt neben der Abteilungsnummer (AbtNr) jeweils den Namen der Abteilung 
(AbtName). Dies ıst insoweit redundant als die Nummer der Abteilung eindeutig auf den 
Namen zurückschließen lässt. Genauso verhält es sıch mit PersNr und PersName. Hier 
könnte etwa zur Abteilungsnummer 2 (eigentlich „Versand”) an einer oder mehreren Stellen 
auch „Fertigung”stehen. Dies wäre ein Fall von Inkonsistenz! 


% Redundanz : Tabelle 


104! Michel 
END). DE: 
Datercaz |] 2» |[rrjre]| von 6 


Und tatsächlich: der Mitarbeiter Möller ıst von Abteilung 3 (Einkauf) ın die Abteilung 5 
(Fertigung) gewechselt (oder umgekehrt); dies ıst offenbar bei den hier gezeigten 
Datensätzen nıcht stimmig abgespeichert. 


AI S1II7 
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In diesem Sinne haben Datenbanken widerspruchsfrei (bzw. konsistent) und für ın der Regel 
mehrere Benutzer und Benutzerinnen (durch dıe Vergabe von Zugriffsrechten) gleichzeitig 
zugänglich zu sein. 

Diese Aspekte führen zum Konzept des Datenbanksystems gemäß der nachfolgenden Skizze. 


Anwendungsprogramme 


... greifen zu auf... 


Externe Sichten (Views) 


Datenbankmanagementsystem 
(DBMS) 


Datenbanksystem 


Bild: Grobskizze Datenbanksystem 


Die Vorteile eines solchen Datenbankmanagementsystems (DBMS): Redundanz wird 
(weitgehend) vermieden, da Informationen über jedes Objekt (in der Regel) nur einmal 
abgespeichert und vom DBMS jedem Anwendungsprogramm in entsprechend geeigneter 
Form zur Verfügung gestellt werden. Soweit Redundanz erwünscht ist, z.B. für effektivere 
Zugriffe auf die Datenbank, wird sie durch das DBMS kontrolliert, wodurch Inkonsistenzen 
vermieden werden. 


Das DBMS sorgt dafür, dass Programme und Daten getrennt sınd, indem es dem 
Anwendungsprogramm genau die benötigten, angeforderten Datenelemente übergibt; die 
interne ÖOrganısation der Daten bleibt damit (generell) dem zugreifenden Programm 
verborgen. Diese Trennung von Anwendungsprogramm und Daten wırd als physische 
Datenunabhängigkeit bezeichnet. 


Es lässt sich zusammenfassen: Eıne Datenbank ıst eine generell auf Dauer und auf 
Programmunabhängigkeit ausgelegte Datenorganısation mit einer ın der Regel großen 
Datenmenge und einer dazugehörigen Datenverwaltung. 


Datenstrukturierung: Die gesamten Daten sollen einen übersichtlichen inneren Aufbau 
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haben, so dass ein Anwender sıch auf bestimmte Daten oder 
Datengruppen beziehen kann. 

Datentrennung: Durch das Trennen der Daten bzw. der Datenorganısation vom 
jeweiligen Anwendungsprogramm ist ein unabhängiges Arbeiten 
möglich. Es können mehrere Anwendungen auf dıe gleichen Daten 
zugreifen. 

Datenredundanz: Sıe entsteht immer dann, wenn gleiche Informationen ın mehreren 
Datensätzen gespeichert werden. Zu verhindern ıst dies durch eine 
saubere Strukturierung der Daten''”. 

Datenkonsistenz: Werden in einer Datenbank gleiche Informationen ın mehreren 
Datensätzen gespeichert, so muss gewährleistet sein, dass eine 
Datenänderung ın einem Datensatz ebenso in den anderen 
Datensätzen vorgenommen wird. 


7.1.3. Drei-Ebenen-Architektur 


Wichtiges Ziel bei Einführung eines Datenbanksystems ıst es, eine solche Datenunab- 
hängigkeit zu erreichen. Dabei wird von der oben erwähnten physischen 
Datenunabhängigkeit gesprochen, wenn für Programme oder interaktive Datenbankzugriffe 
dıe konkrete physische Organısatıon irrelevant ıst. Im Idealfall können dann Daten sogar 
physisch ganz neu gespeichert werden, ohne dass dies irgendwelche Änderungen an den 
entsprechenden Anwendungsprogrammen erfordern würde. 
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Se Datenbank 


Auf der anderen Seite ıst es erwünscht, dass eın Datenbanksystem auch logische Daten- 
unabhängigkeit garantiert, es soll unterschieden werden können zwischen einer konkreten, 


117 Es sei allerdings angemerkt, dass bisweilen Redundanz bewußt in Kauf genommen wird um die Performance zu erhöhen. 
In diesem Fall ıst aber ganz besonders darauf zu achten, dass das Datenbanksystem die Konsistenz permanent überwacht. 
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anwendungsorientierten „Siıcht” auf die Datenbank und deren logischer Gesamtstruktur; diese 
Gesamtstruktur soll verändert werden können, ohne dass alle Sıchten geändert werden 
müssen. Diese Argumente führen zu einem Datenbankdesıgn auf drei Ebenen gemäß dem 
ANSI-Architekturkonzept. 


Die interne Ebene ıst der physikalischen Abspeicherung am nächsten, ıst aber unterscheidbar 
von dieser, da sıe die physischen Daten als interne Datensätze (Records) ansıeht. Diese 
interne Sicht der Daten wird im internen Schema festgelegt: hier werden dıe Datenstrukturen 
und erforderlichenfalls spezielle Zugriffsmechanismen definiert. 


Auf der konzeptionellen Ebene wird die logische Gesamtsicht aller Daten der Datenbank 
sowie deren Beziehungen untereinander Im konzeptionellen Schema 
(Datenbank-Konzeption) repräsentiert. Die hier verwendeten Datenmodelle abstrahieren von 
der ınternen Sıcht und der konkreten Abspeicherungsform. 


Die externe Ebene schließlich beinhaltet dıe einzelnen Sichten (Views) der einzelnen 
Benutzerinnen und Benutzer, d.h. der Anwendungsprogramme und der interaktiven 


Datenbankzugriffe. 
Benutzer/in 1 Benutzer/in 2 | Benuzermn | 


Benutzerschnittstelle 


externes Schemal |externes Schema |externes Schema 


Schnittstelle externes Schema - konzeptionelles Schema 


konzeptionelles Schema 


Schnittstelle konzeptionelles Schema - internes Schema 


internes Schema 


Schnittstelle internes Schema - Datenbank 


Datenbank 
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Bild: Drei-Ebenen-Architekturkonzept 


7.1.4. Komponenten eines Datenbankmanagementsystems 


Ein Datenbanksystem (DBS), eine Datenbankumgebung (data base environment, DBE) 
entsteht durch die Einrichtung einer oder mehrerer (oder formal auch null) Datenbanken 
unter einem Datenbankmanagementsystem (DBMS). 


Dabeı ıst das DBMS die Software, die für die Umsetzung der oben skizzierten 
Anforderungen und Konzepte zu sorgen hat. 


In Erweiterung des Drei-Ebenen-Architekturkonzeptes wird unterschieden zwischen dem 
DBMS, welches sıch als geladenes Programm ım Arbeitsspeicher befindet, und den 
Datenbeständen, auf denen es arbeitet. Einer dieser Datenbestände ıst die Datenbank selbst, 
ein anderer dıe Beschreibung der den drei Ebenen zugeordneten Schemata, die generell wıe 
die Datenbank selbst auf Massenspeicher abgelegt und als Data Dictionary (DD) bezeichnet 
wird. 


Der Benutzer eines Datenbankprogramms nımmt ın der Regel nur das sogenannte Front End 
wahr, z.B. die Masken und Dialogfenster von Microsoft Access oder anderen Programmen. 
Hier werden ın irgendeiner Form (Schaltknopf, Texteingabe, Mausklick usw.) Befehle 
eingegeben („Zeige mir alle Datensätze...”), die das Front End entgegennimmt und zur 
Bearbeitung an die Kernanwendung weiterreicht. 


Ein an dıe Datenbank gerichteter Benutzerauftrag (in Form eines Kommandos der 
sogenannten Data Manipulation Language (DML) oder eben per Eingabemaske aufbereitet) 
wird zunächst einem Parser übergeben, der die syntaktische Analyse durchführt, also den 
abgesetzten Befehl auf seine korrekte Syntax (Schreibweise) überprüft. Hierbei werden 
teilweise auch Informationen aus dem Dictionary benötigt, so dass hier schon eine 
Verbindung zum sogenannten Dictionary-Manager bestehen muss. 

Finden diese Aufträge innerhalb von Programmen statt, so wird üblicherweise eın 
Precompiler oder Preprocessor erforderlich sein, der eine bestehende Programmiersprache 
(z.B. Pascal oder C) um Datenbankzugriffsanweisungen erweitert. Ungeachtet der konkreten 
Zugriffsform wırd ein DB-System jedoch dıe Zugriffsbefugnis überprüfen müssen: ist ein 
abgesetzter Befehl für den betreffenden Benutzer überhaupt „legal””? 


Bei Updates (Aktualisierungen) ıst die Ausführung ım allgemeinen an 
Integritätsbedingungen geknüpft, welche dıe Konsistenz der Datenbank gewährleisten sollen. 
Dabei handelt es sich um Bedingungen der betreffenden Anwendung, beispielsweise 
„Gehälter sind stets positiv’ oder „Kraftfahrzeugkennzeichen sind stets eindeutig’, welche 
bei der Definition des konzeptionellen Schemas festgelegt und zur Laufzeit vom DBMS 
automatisch (ohne Benutzereingriff) überwacht werden. Intern muss ın diesem 
Zusammenhang ım Mehrbenutzerbetrieb (Netzwerkumgebungen!) ebenfalls kontrolliert 
werden, ob sıch gegebenenfalls parallel ablaufende Benutzeraufträge beeinflussen. 


Weiterhin ıst es erforderlich, dass externe Anfragen ın das konzeptionelle Schema übersetzt 
und eventuelle Abkürzungen, dıe den Anwender(inne)n die Bedienung des Systems 
erleichtern, durch ıhre orıginären Definitionen ersetzt werden. Dabei muss auch 
berücksichtigt werden, dass Anfragen unnötig verkompliziert gestellt werden können: eın 
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Optimizer tut dann sein Bestes, eine (im Hinblick auf Laufzeit und/oder 
Speicherplatzverhalten) effizientere Formulierung für dıe gleiche Fragestellung zu finden. 


Eine weitere Aufgabe des DBMS besteht ın der Erstellung eines Zugriffs- oder 
Ausführungsprogrammes, einer Code-Generierung für den Benutzerauftrag. Jeder Auftrag, 
ob programmatisch oder ınteraktiv abgesetzt, führt schließlich zu einer Sequenz von Lese- 
und evtl. Schreibbefehlen auf den Speichermedien. 


Generell arbeitet nıcht ein einzelner Benutzer exklusiv mit einer ganzen Datenbank, sondern 
diese steht mehreren Personen gleichzeitig offen. Die aus einem einzelnen Auftrag gemäß 
dem hier beschriebenen Ablauf erzeugte Befehlsfolge wırd DBMS-ıntern als Transaktion 
bezeichnet. Die für den Multi-User-Betrieb zu lösende Schwierigkeit besteht darin, 
(quası-)parallel ablaufende Transaktionen zu synchronisieren. 


Dieser Transaktions-Manager arbeitet nach dem „Alles-oder-nichts”-Prinzip: jede 
Transaktion wird stets vollständig oder gar nicht ausgeführt. Bei der Ausführung kann 
es allerdings vorkommen, dass der Transaktions-Manager feststellt, dass eine gerade laufende 
Transaktıon nıcht erfolgreich beendet werden kann; ın einem solchen Fall übergibt er sıe 
einem Recovery-Manager, dessen Aufgabe es ıst, die Datenbank ın genau den Zustand zu 
versetzen, ın dem sıe sich vor dem Start dieser speziellen Transaktion befunden hat. Dazu 
wird das Logbuch (Protokoll) der Datenbank verwendet, in welchem u.a. die getätigten 
Veränderungen verzeichnet werden. 


Der Recovery-Manager muss ebenfalls aktıv werden, wenn soft- oder hardwaremäßlige Fehler 
im System auftreten; aus diesem Grund ıst es ın der Praxis erforderlich, dass sıch Kopien der 
Logbücher auf separaten Speichermedien befinden. Zum Teil werden auch mehrere 
Logbücher parallel (auf verschiedenen Festplatten) mitgeführt. 


7.1.5. Der Datenbank-Lebenszyklus 


Mit der Planung einer Datenbank beginnt, ähnlich wıe beim Software-Engineering für 
Programme, eın Datenbank-Lebenszyklus. Gemäß Vossen/Witt [Vossen] zerfällt dieser ın die 
folgenden Teilschritte (Zop-Down-Vorgehen), bei denen die ersten vier Schritte unabhängig 
von der Wahl des konkreten Systems gehalten sınd. 


7.1.5.1. Anforderungsanalyse und -Spezifikation 


Die potentiellen bzw. künftigen Datenbank-Benutzer/innen sınd zu befragen, über was 
welche Daten, für welchen Zweck welche Daten gespeichert werden und wie sıe verarbeitet 
werden sollen. Darunter fallen auch Abschätzungen der zu erwartenden Anfrage- und 
Änderungshäufigkeiten der Daten und die Zuordnung von Zugriffsrechten. 


Für die Konsistenz und Integrität der Datenbank ıst wichtig festzustellen, welchen 
Bedingungen (Wertebereiche, Plausibilitäten, Abhängigkeiten) dıe Daten genügen sollen. 
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7.1.5.2. Konzeptioneller Entwurf 


Der konzeptionelle Entwurf formalısiert das Ergebnis der Anforderungsanalyse. Die 
Anforderungen einzelner Benutzer(gruppen) werden hierbei zunächst in externen Sichten 
einzeln modelliert und ın den externen Schemata formal erfasst. 


Diese Einzelsichten werden einer Sıcht-Integration unterzogen, in eine konzeptionelle 
Globalsicht der Anwendung umgewandelt; hierbei müssen insbesondere (unerwünschte) 
Redundanzen und Inkonsistenzen erkannt und beseitigt werden. 


Resultat dieses Arbeitsschrittes ıst eine vollständige formale Beschreibung der Anwendung, 
das sogenannte konzeptionelle Schema. Die Formalısierung erfolgte mit einem 
implementierungsunabhängigen, möglichst graphisch darstellbaren Datenmodell, zum 
Beispiel mit dem Entity-Relationship-Modell (ERM). 


7.1.5.3. Logischer Entwurf 


Im logischen Entwurf wird ein konzeptionelles Schema ın eın /ogisches Schema überführt, 
das ein Datenmodell des zur Verfügung stehenden Datenbankmanagementsystems 
verwendet, bei uns das Modell der relationalen Datenbanken. 


Dieses ıimplementationsunabhängige Datenmodell der Anwendung muss ın Beschreibungen 
der zugrundeliegenden Relationen umgesetzt werden. Jede Relation wırd ım logischen 
Schema durch ein Relationenschema beschrieben, welches den Namen der Relation, ihre 
Attrıbutbezeichnungen, die Wertebereiche der Attribute und die Integritätsbedingungen (z.B. 
in Form von Abhängigkeiten zwischen Attrıbuten) enthält. 


Vossen und Witt merken an, dass eın logischer Entwurf vor allem beı kleineren 
Anwendungen auch ohne vorherigen konzeptionellen Entwurf möglıch ıst, davon jedoch 
abzuraten sei, da der konzeptionelle Entwurf implementierungsunabhängig erfolgt und somit 
durch das Zielsystem bedingte Modellierungseinschränkungen eigentlich zunächst ignoriert 
werden können. 


7.1.5.4. Implementierungsentwurf 


Beim /mplementierungsentwurf wird das logische Schema unter allgemeinen oder aus der 
Anforderungsanalyse sıch ergebenden speziellen Kriterien optimiert. Unter allgemeinen 
Kriterien ıst ım Falle des Relationenmodells das Normalisieren der Relationen bezüglıch 
ihrer internen Abhängigkeiten zu verstehen, womit Redundanzen vermieden werden. 


Die aus dem Normalisierungsprozeß3 entstehenden Relationen heißen Basisrelationen. Zur 
Realisierung der im konzeptionellen Entwurf festgelegten externen Sichten werden beı der 
Implementierung die Sıchten, denen keine Basısrelationen entsprechen, sondern die sıch aus 
Teilen einer oder mehrerer Basıstabellen zusammensetzen, durch sogenannte Views 
beschrieben. 


Die Gesamtheit der Relationenschemata für Basısrelationen und Vıews sowıe die 
vereinbarten Zugriffsrechte bilden das Datenbankschema - die Grundlage für die 
Implementierung. 
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7.1.5.5. Implementierung 


Die /mplementierung besteht ım Einrichten der Datenbank mit der Datendefinitionssprache 
(engl. data definition language, DDL) des konkret zur Verfügung stehenden 
Datenbankmanagementsystems. 


Dies beinhaltet die Implementierung der Basısrelationen und gegebenenfalls der Views, die 
konkrete Erteilung der Zugriffsrechte und die Festlegung von Indexen als Suchpfaden, über 
dıe Anfragen möglıchst effizient beantwortet werden können. 


Das ın SQL implementierte Datenbankschema wird ın sogenannten Systemtabellen abgelegt. 


Bei Microsoft Access stellen sıch viele der hier dargestellten Punkte aufgrund der oft 
suggestiven Wındows-Benutzeroberfläche vereinfacht dar; ım Hintergrund müssen allerdings 
dıe hier aufgeführten Punkte von der Software umgesetzt werden. 


7.1.5.6. Arbeiten mit der Datenbank und Reorganisation 


Die Arbeit mit einer Datenbank beinhaltet das Einfügen (insert), Löschen (delete), Ändern 
(update) und Abfragen (select) von Daten (mittels der data manipulation language, DML 
oder eben wieder über die Dialogboxen wie bei Access). 


Existiert eine Datenbank über einen längeren Zeitraum, so wird sıch mitunter nicht nur ıhr 
Inhalt, sondern auch ıhre (eigentlich festgelegte) Struktur aufgrund neuer Anforderungen 
ändern. Dies muss durch dıe DDL des konkreten Datenbanksystems durch Einrichten, 
Ändern und Löschen von Relationen, Attributen und Indexeinträgen unterstützt werden. 
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7.1.6. Zur Wiederholung: Begriffe aus der Mengenlehre 


Nachfolgend einige für die Konzeption von Datenbanken relevante Begriffe aus der 
Mengenlehre; dieser Abschnitt wurde teilweise entnommen aus Vetter [Vetter]. 


7.1.6.1. Grundlegendes 


Eine Menge ist eine eindeutig definierte Zusammenfassung wohlunterscheidbarer Objekte, 
sogenannter Alemente. Sie kann konkret festgelegt werden durch Auflistung aller einzelnen 
Elemente oder in beschreibender Form. In einem konkreten Kontext ist die 
Zusammenfassung aller möglichen, zu betrachtenden Objekte die sogenannte Grundmenge. 


Notation: Eine Menge A kann geschrieben werden mit geschweiften Klammern, z.B. 
A :={1,2,3 } oder A :={ x |x ıst eine natürliche Zahl }. 


Eine Menge verfügt (für sich gesehen) über keinerlei Ordnung, keine Reihenfolge. Die 
Mengen { 1,2,3 } und { 3,1,2 } sınd also ıdentisch. Ebenso ıst es nur relevant, ob ein Element 
überhaupt in einer Menge vorkommt oder nicht: { 1,23 } und { 1,2,1,3,2 } sind also 
Beschreibungen für ein und dieselbe Menge (mit drei Elementen). 


Notationen: Sei G eine Grundmenge; seien A und B spezielle Mengen, sei x ein Objekt 
(Element der Grundmenge). Istx ın A enthalten, so schreiben wiırx e A (x ıst Element von 
A); ist dies nıcht der Fall, so schreiben wirx € A (x ıst kein Element von A). 


Sınd alle Elemente aus A auch ın B enthalten, so ıst A eine Teilmenge von B, B ist eine 
Obermenge von A. (Notationen: ACc Bbzw.B2=- A.) 


Ist A eine Teilmenge von B und B eine Teilmenge von A, so sınd A und B gleich, andernfalls 
ungleich. (Das heißt banaler ausgedrückt: A und B sınd gleich, wenn sıe dieselben Elemente 
beinhalten.) 


Ist kein Element von A ın B und keın Element von B ın A enthalten, so heißen A und B 
disjunkt (altdeutsch: e/ementefrema). 


Sind ın B genau all dıe Elemente der Grundmenge G, die nıcht ın A enthalten sind, so heißt B 
das Komplement (oder dıe Gegenmenge oder auch Ergänzungsmenge) von A. (Manchmal 
wird das notiert mıt B= G\A.) 


Die Menge ohne jedes Element heißt /eere Menge, { \}. 


Hat eine Menge A endlich viele Elemente, so heißt A eine endliche Menge, andernfalls 
spricht man von einer unendlichen Menge. Die Anzahl der Elemente heißt auch Mächtigkeit 
der Menge: dies ıst eine natürlıche Zahl (inklusive der O0) oder das Symbol & (unendlich). 


7.1.6.2. Das kartesische Produkt (Geordnete Paare und n-Tupel) 


Es seien A und B zweı Mengen, ae A,b e B. Ein geordnetes Paar (oder 2-Tupel) (a,b) ıst 
eine Zusammenfassung der beiden Objekte a und b, beı der die Reihenfolge relevant ıst. Das 
heißt: dıe geordneten Paare (a,b) und (b,a) sınd (falls a # b gilt) verschieden voneinander, 
also (a,b) # (b,a). 


- 209 - 


Das kartesische Produkt der Mengen A und B, A x B, ıst definiert als die Menge aller 
geordneten Paare (a,b) mitae Aundbe B, formelhaft: AxB = { (a,b)lae A,beB!}. 


Beispiel: Ist A := { 1,2,3 } und B := { 0,1 }, so ıst das kartesische Produkt A x B die Menge 
{ (1,0), (1,1), (2,0), (2,1), 3,0), (3,1) }. (Die Mächtigkeit des kartesischen Produktes ist 
offensichtlich das Produkt der einzelnen Mächtigkeiten von A und von B, was großzügig 
auch auf das Symbol & ausgedehnt werden kann.) - Aber es kann auch B x B gebildet 
werden: das ıst die Menge { (0,0), (0,1), (1,0), 1,1) }. 


In Analogie zum geordneten Paar (oder 2-Tupel) spricht man allgemeiner (für n > I) von 
einem (geordneten) n-/upel, wenn n Objekte (unter Beachtung der Reihenfolge) 
zusammengefasst werden: (aı, ... ‚An). 


Sind Aı, ... An n (beliebige) Mengen (n > 1), so heißt die Menge aller entsprechend 
gebildeten n-Tupel (a,, ... ,‚.) (mita; e A; für l<ı<n) das kartesische Produkt der Mengen 
Ai, ... An. (Für n = 3 spricht man von Tripeln, bei n = 4 von OQuadrupeln, dıe weiteren Werte 
für n wollen wir hier nervenschonenderweise übergehen.) 


Beispiel: Sind V := { DABI1, DAB2, MAT } (Vorlesungen an einer Universität), 

P := { Meıer, Braunsfeld, Krähwinkel } (Professor(inn)en daselbst) und 

R := { Hörsaal-A, Hörsaal-B, Seminarraum }. 

Dann ist das kartesische Produkt V x P x R die Menge aller 3-Tupel, die (in dieser 
Reihenfolge!) aus jeweils einer Vorlesung, einem Professor (oder einer Professorin) und 
einem Raum bestehen. 


Streng formal ist natürlich VxPx RzPxVxR; es besteht jedoch eine naheliegende 
l:1-Beziehung zwischen diesen beiden Mengen (durch Vertauschen der ersten und zweiten 
Komponenten). 


7.1.6.3. Relationen 


Eine binäre Relation R (zweiwertige Relation) zwischen einer Menge A und einer Menge B 
ist eine Teilmenge des kartesischen Produktes AxB: ae Aundb e B stehen ın der Relatıon 
R zueinander genau dann, wenn (a,b) €e R ıst. Eine binäre Relatıon ıst also eine Menge 
geordneter Paare. Dies kann ım Spezialfall auch dıe leere Menge sein. 


Beispiel: Sind V und P die Mengen (Vorlesungen bzw. Professor(inn)en) wıe zuvor, dann ist 
R: := { (DAB1,Meıer), (DAB2,Braunsfeld), (MAT,Braunsfeld) } eine binäre Relatıon 
zwischen V und P. (Eine eventuelle inhaltliche Interpretation ıst naheliegend...) 


Als Tabelle dargestellt: 


R V P 
DABI Meier 
DAB2 Braunsfeld 
MAT Braunsfeld 


Eine n-werfige Relation R (auch n-stellige Relation oder n-ary relation genannt) zwischen n 
Mengen A,ı bıs A, (n > 1) ıst entsprechend eine Teilmenge des kartesıschen Produktes dieser 
n Mengen (in dieser Reihenfolge), ıst somit eine Menge geordneter n-Tupel. 
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Beispiel: Im obigen Beispiel der Universität ıst 
R; := { (DABI1,Meiıer,Hörsaal-B), 
(DAB2,Braunsfeld,Seminarraum), 
(MAT ,Braunsfeld,Hörsaal-B), 
(DAB1,Krähwiınkel,Hörsaal-A) } 
also eine dreistellige (oder dreiwertige) Relatıon. 


7.1.6.4. Projektionen 


Ist R eine n-stellige Relation zwischen A\,, ... und A,, dann heißt eine Abbildung (Funktion), 
dıe aus jedem n-Tupel von R (bzw. aus Aı x ... x A.) eine festgelegte Komponente 
herausfiltert, eine elementare Projektion. 


Beispiel: Sei R; die dreiwertige Relation von oben. Dann ist dıe Abbildung 
pı :VxPxR->V 


mit der Funktionsvorschrift pı((v,p,r)) := v die Projektion auf die 1.Komponente (hier: dıe 
Menge der Vorlesungen). So ıst zum Beispiel pı((DAB1,Meier,Hörsaal-B)) = DABl und 
pı((MAT,Braunsfeld,Hörsaal-B)) = MAT. 


Eine Abbildung p, die k der n Komponenten herausfiltert (k < n), heißt (allgemeine) 
Projektion. Wird eine Projektion auf eine Relation angewendet, so ergibt sich wiederum eine 
Relation. 


Beispiel: Für die obige Relation R; ıst die Abbildung p: :VxPx R->VxR mit 
Pı2((v,p,r)) := (v,p) die Projektion auf die ersten beiden Komponenten. Beispielsweise sınd 
pı2((DABI1,Meıer,Hörsaal-B)) = (DABI1,Meıer) und pı.((MAT,Braunsfeld,Hörsaal-B)) = 
(MAT ,Braunsfeld). 


7.1.6.5. Natürlicher Verbund (Natural join) 


Unter dem natürlichen Verbund (natural join) versteht man die Verkettung zweier 
Relationen zu einer neuen Relatıon. Sind R eine Relation zwischen A und B und S eine 
Relation zwischen B und C, wobei die Mengen A, B und C selbst bereits kartesısche 
Produkte sein dürfen, dann ergibt sıch der natürliche Verbund von R und S als diejenige 
Relatıon T, die definiert ıst als 


T:= { (ab,c) |(a,b)ER, (b,c)e S }. 


Ein Tupel (a,b,c) liegt somit genau dann ım natürlichen Verbund von R und S (also ın der 
Relation T), wenn das Tupel (a,b) ın der Relatıon R liegt und (b,c) zu S gehört. 


Beispiel: Es seı R eine binäre Relation zwischen den Mengen A := { SI, S2, S3 } 
(Matrikelnummern von Student(inn)en) und B := { Herrmann, Müller, Weber } (Namen 
derselben): R := { (S1,Herrmann), (S2,Müller), (S3,Weber) }. S seı eine binäre Relatıon 
zwischen der Menge B und der Menge C = { DABI, DAB2, MAT 

= { (Herrmann,DABl1), (Herrmann,MAT), (Weber,DAB2), (Weber,MAT) }. (Der Student 
Müller ıst eine faule Socke.) 
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Dann ist der natürliche Verbund von R und S die Relation T:= { (S1,Herrmann,DABI), 
(S1,Herrmann,MAT), (S3,Weber,DAB2), (S3,Weber,MÄAT) }. 


Jedes dieser Dreiertupel hat also die Eigenschaft, dass die ersten beiden Komponenten ın 
Relation R zueinander stehen (-dıe ersten Komponenten sınd dıe Matrikelnummern der ın der 
zweiten Komponente genannten Studierenden-) und sich die letzten beiden Komponenten ın 
Relation S zueinander befinden (-dıe Person, dıe ın der 2.Komponente genannt ist, besucht 
dıe Vorlesung, dıe ın der 3.Komponente steht-); auf diese Weise ıst durch diese natürliche 
Verknüpfung ersichtlich, welche Matrıkelnummern auf dıe Vorlesungsscheine gehören. 


7.2. Datenbankentwurf 


Die wichtigsten Themen auf dem Gebiet des Datenbankentwurfes sollen nachstehend 
angesprochen werden, bevor es ım nächsten Kapitel dann um die praktische Arbeit mit dem 
Datenbanksystem Microsoft Access gehen wird. 


7.2.1. Entity-Relationship-Modell 


Zur (auch) graphischen Darstellung des konzeptionellen Entwurfs dient das 
Entity-Relationship-Modell (ERM), 
das die reale Welt ın Objekte 
unterteilt, zwischen denen 
Beziehungen (Relationen) bestehen 
können. Im nebenstehenden Bild 
wird eine Beziehung zwischen den 
Tabellen „Mitarbeiter” und 
„MitarbWohnung” gezeigt: hier 
wird modelliert, dass ein Mitarbeiter 
auch mehrere Wohnungen mit 
separaten Anschriften haben kann. 


Wohlunterscheidbare Dinge, die ın der realen Welt existieren, werden Zntities (unschön 
eingedeutscht Anritäten) genannt. Beispiele hierfür sınd „der Kunde mit der Kundennummer 
123” oder „das Dienstfahrzeug mit dem Kennzeichen FH-DW 1998”. 


Einzelne Entities, welche ın einem speziellen Sınn ähnlıch oder zusammengehörig sınd, 
können zu Entity-Sets zusammengefasst werden. Beispiele hıerfür sınd „alle Mitarbeiterinnen 
und Mitarbeiter der Fabrık X” oder „alle Dienstfahrzeuge der Fırma Y”. 


Entities besitzen Eigenschaften (etwa Farbe, Länge, Größe, Geburtsdatum, Anschrift etc.), 
dıe Werte genannt werden. Die Zusammenfassung aller möglichen oder aller zugelassenen 
Werte für eine Eigenschaft nennt man deren Wertebereich. Auf der Ebene eines Entity-Sets 
werden die beı allen Entities (dieses Sets) auftretenden Eigenschaften Attribute genannt. 


Beispiel: In einer FADW-Studentenverwaltung können beispielsweise Informationen über 
Student/inn/en, Dozent/inn/ien und den konkreten Vorlesungsplan festgehalten werden. 
Entities sınd hier dıe Studentin Meier [sofern dies bereits eine Person eindeutig festlegt!], 
Dozent Prof. Schäfer oder dıe Vorlesung „Wirtschaftsmathematik I” ın der Gruppe 
„Mittelständische Wirtschaft MW9]”. 
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Die Student/inn/en bilden das Entity-Set Student, dıe Dozent/inn/en das Entity-Set Dozent, 
dıe konkret (z.B. in einem bestimmten Semester) geplanten und gehaltenen Vorlesungen das 
Set Vorlesung. - Attrıbute mit möglichen Wertebereichen in diesem Zusammenhang können 
z.B. sein: 


Nachname Characterstring (Zeichenkette) 
Bemerkung Characterstring mit 256 Zeichen 
MitarbeiterNr achtstellige ganze Zahlen 

Gehalt numerisch mit zwei Nachkommastellen 
Telefonkurzwahl numerisch 

Geschlecht Character (einzelnes Zeichen) 


Es kann erforderlich sein, für gewisse Attribute neben den eigentlich möglichen, denkbaren 
Werten einen sogenannten Nullwert (ein englisch ausgesprochenes NULL) zuzulassen. Dieser 
Nullwert kann dann verwendet werden, falls ein konkreter Wert für ein Entity dieses Sets 
noch nicht bekannt ıst oder vielleicht nıe existieren wird. So kann z.B. das numerische 
Attrıbut Telefonkurzwahl gedanklich ‚leer” bleiben, wenn für eine/n Mitarbeiter/in eine 
solche Kurzwahl (noch) nicht existiert, datenbanktechnisch wırd jedoch durch den 
besonderen Wert NULL eine Abfrage auf diesen Wert ermöglicht und es kann festgestellt 
werden, dass eben keine Kurzwahl eingetragen ist. 

Wichtig: Dieser Nullwert hat mit der ansonsten auftauchenden Zahl O nıchts zu tun! 


Andere Attribute wiederum dürfen vom Verwendungszweck her nicht „leer” bleiben, dort 
wırd man davon ausgehen müssen, dass stets ein Wert zu jedem Entity eingetragen ist; dies 
ist z.B. bei der MitarbeiterNr denkbar. Dieses Attribut darf also keine Nullwerte 
aufnehmen, es ist im Gegenteil (in der Praxis) ein identifizierendes Attribut, ein 
sogenannter Schlüssel (key), d.h. etwas mit einer minimalen identifizierenden Eigenschaft. 
Konkret wird über das Schlüsselattribut MitarbeiterNr ein/e konkrete/r Mitarbeiter/in 
eindeutig zu finden sein. 


Die Beziehungen unter Entity-Sets heißen auch Relationships. In deren Deklarationen 
werden die (prinzipiell) zeitunabhängigen Aspekte festgelegt, konkrete Tupel dieser 
Relationen stellen dann die zeıtveränderlichen Informationen dar. 


Beispiel: Das Entity-Set Person beinhalte verschiedene Attribute über Personen, z.B. Name, 
Vorname, Geburtsdatum etc. Eine Relation Mutter über den (beiden) Entity-Sets Person und 
Person (!) kann dann für konkrete Tupel ausdrücken, dass eine Person die Mutter einer 
anderen ist. Das spezielle Tupel Mutter(Helga,Ortwin) ıst (wegen des männlichen 
Vornamens, der ım Tupel auftritt) semantisch eindeutig als „Helga ıst die Mutter von 
Ortwin” interpretierbar. Das Tupel Mutter(Helga,Anna) zeigt jedoch, dass solche 
semantischen Interpretationen nıcht immer für die gewünschte Information ausreichen, d.h. 
de facto spielt dıe Reihenfolge ın einer Relatıon eine gravierende Rolle, dıe anfangs natürlich 
definiert werden muss. (So wırd ım obigen Kontext Mutter(Helga, Anna) sinnvollerweise für 
„Helga ıst die Mutter von Anna” stehen.) 


118 Hier muss man dann bei Datenbankprogrammen wıe Access die Auswahl „Eingabe erforderlich” ankreuzen, damit die 
Software überwacht, dass das betreffende Feld auch immer ausgefüllt wird. 
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Beispiel: Es seı wieder ein Entity-Set Person gegeben mit den Attributen PersNr (als 
Schlüssel), Nachname, Vorname. Konkrete Tupel könnten die Folgenden sein. 


PersNr Nachname Vorname 
100 Berg Gustav 
101 Berg Theodor 
102 Berg Ulrike 
103 Berg Viktor 
104 Berg-Feuerstein Andrea 


Eine Relation Verheiratet auf den Sets Person und Person kann nun Tupel der Gestalt 
Verheiratet(100, Berg, Gustav, 102, Berg, Ulrike) besitzen. Im Zusammenhang der gesamten 
Datenbank kann aber auch mit der viel „kleineren” Relation Verh mit Tupeln der Gestalt 
Verh(100,102) dieselbe Information verwaltet werden, da die beiden verwendeten Attribute 
der Relation Verh gerade die Schlüsselattribute der beiden beteiligten Entity-Sets sind. 


In der graphischen ERM-Darstellung werden Entity-Sets rechteckig dargestellt, Relationen 
mit Rauten und die beteiligten Attrıbute in Elliıpsen jeweils angehängt; Schlüsselattribute 
werden unterstrichen. Dabei können Attribute auch an Relationen angehängt werden, wie es 
beı der Relation Verheiratet der Fall ıst. Da ın der Relation jedoch mindestens die 
Schlüsselattribute der beteiligten Entity-Sets vorkommen müssen, werden diese oftmals ın 
der Graphik weggelassen. 


Reiation"_| Entity-Set2 


Set-1 


Bild: Graphische Darstellung - Entity-Relationship-Diagramm 


Der am häufigsten auftretende Fall ın der Praxis sınd zweistellige Relationen, d.h. Relationen 
auf zwei (nicht unbedingt verschiedenen) Entity-Sets. Unter der Komplexität einer solchen 
Relation versteht man dıe Angabe darüber, mit wıevielen Entities des ersten Sets eın 
bestimmtes Entity des zweiten Sets ın Beziehung stehen kann, darf, evtl. ım Zusammenhang 
auch muss. (Anmerkung: Den Begriff der Komplexität gıbt es auch allgemein für 
mehrstellige Relationen.) 


Die einfachste Komplexität einer zweistelligen Relation ist 1:1 (one-to-one), bei der jedes 
Entity aus dem einen Set mit höchstens (!) einem Entity des zweiten Sets ın Beziehung steht 
(und umgekehrt). Ein Beispiel hierfür ıst im abendländischen Kulturraum die Relation 
Verheiratet. 


Eine Relation zwischen den Entity-Sets Eı und E>, bei welchem eın Entity ın Eı mit keinem, 
einem oder mehreren Entities von E; ın Beziehung steht, jedes Entity ın E, sıch jedoch 
höchstens mit einem Entity aus Eı ın Relation befindet, wird many-to-one (m:1 oder I:n) 
genannt. Eın Beispiel hierfür sind die Relationen Mutter oder Vater. 
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Bestehen diese beiden Einschränkungen nicht, so spricht man von einer m:n-Beziehung 
(many-to-many). Hierfür ıst ein Beispiel eine Relation Unterrichtet(Dozent,Fach), mit der 
ausgedrückt werden kann, dass ein Dozent mehrere Fächer unterrichten kann, ein Fach aber 
auch (in der Regel) von mehreren Dozenten unterrichtet wird. 


Eine besondere Relation hört auf den Namen 75-A. Dabeı handelt es sich um eine zweistellige 
Relation zwischen Entity-Sets Eı und E; („Eı ıst ein E>”), mit der ausgedrückt wird, dass es 
sich bei Eı um eine Spezialisierung von E; handelt. Dies ıst im Prinzip dasselbe wıe eine 
Teilmengenbeziehung, d.h. E, könnte auch ın E, aufgenommen, integriert werden. Die 
entsprechend hinzukommenden Attribute von Eı würden in diesem Fall jedoch beı 
sämtlichen Tupeln von E; (mit sinnvollerweise NULL-Werten) mit auftreten, was weder 
realisierungstechnisch noch logisch wünschenswert scheint. 


Beispielsweise kann ein Entity-Set Abteilungsleiter ın eine IS-A-Beziehung zum Set aller 
Mitarbeiter gebracht werden; neben den allgemeinen, auch für Abteilungsleiter zutreffenden 
Attrıbuten, dıe für Mitarbeiter/innen verwaltet werden, können ın das Set Abteilungsleiter 
alle spezifisch zutreffenden Attribute aufgenommen werden. 


Der Fall einer 1:n-Beziehung kann (technisch) ohne eigenständige Relation abgespeichert 
werden. Eine Relation „Wird Frteilt Von” zwischen den Entity-Sets Auftrag und Kunde 
kann mit ın das Set Auftrag integriert werden, indem der Schlüssel KundenNr aus Kunde als 
eigenes Attribut zu Auftrag hinzugefügt wird. 


7.2.2. Normalisierung 


Ziel eines Datenbanksystems ıst es unter anderem, zu jedem Zeitpunkt widerspruchsfreie, 
konsistente Datenbestände zu verwalten. Fehlen oder widersprechen sıch Informationen, so 
bezeichnet man dies als Speicheranomalie. Um diese zu vermeiden, somit dıe Konsistenz zu 
erhalten, ist die Normalisierung der Relationen (Tabellen) erforderlich, die ın folgende Stufen 
eingeteilt wird. 


7.2.2.1. Unnormalisierte Relation 


Eine unnormalısıerte Relation ıst daran erkennbar, dass sie Attribute (Spalten) mit 
mehrelementigen Attrıbutswerten beinhalten kann. 

Das Hauptproblem beı unnormalisıerten Tabellen ıst dıe Tatsache, dass es EDV-technisch 
aufwendig(er) ıst, einen Datenbestand zu verwalten, bei dem ın jeder Zeile (in jedem Tupel) 
verschieden vıele Eintragungen auftreten können. 


Beispiel: Die folgende Tabelle stellt eine unnormalısıerte Relation dar, denn das Attribut 
Studienfach kann mehrere Attrıbutwerte aufweisen. 


StudentNr Name Studienfach 

S1001 Meier, Gerda Mathematik, Physik 
S1002 Müller, Erwin Mathematik, Chemie 
S1003 Weber, Karla Jura 


2152 


7.2.2.2. Erste Normalform (1NF) 


Eine Relatıon ıst in erster Normalform (1NF), wenn alle nicht dem Schlüssel zugehörigen 
Attribute funktional abhängig vom Gesamtschlüssel sınd; anders ausgedrückt: ın einer 
INF-Relatıon hat jedes Attribut stets höchstens einen Wert. 


Beispiel: Die folgende Tabelle stellt eine Relation in erster Normalform dar. 


Student\r Name StudFachNr Studienfach 
S1001 Meier, Gerda 1 Mathematik 
S1001 Meier, Gerda 2 Physik 
S1002 Müller, Erwın 1 Mathematik 
S1002 Müller, Erwin 2 Chemie 
S1003 Weber, Karla 1 Jura 


7.2.2.3. Zweite Normalform (2NF) 


Eın Problem, das ın dem Beispiel eben bei einer INF-Relatıon auftritt, ıst die prinzipielle 
Möglichkeit, einen Eintrag wıe z.B. „S1003, Huber, Florian ...” ın die Datenbank 
aufzunehmen, da der Schlüssel zusammengesetzt ıst aus StudentNr und StudFachNr. 
Gleichzeitig erkennen wir jedoch, dass das Attrıbut Name funktional abhängig ıst bereits 
vom Schlüsselteil StudentNr alleine! Dies führt zu der folgenden Definition der zweiten 
Normalform. 


Eine Relatıon befindet sich ın zweiter Normalform (2NF), wenn jedes nıcht zum Schlüssel 
gehörige Attrıbut funktional abhängig ıst vom Gesamtschlüssel, nicht aber von 
Schlüsselteilen. Anders formuliert: eine Relatıon ıst 2NF, wenn sıe INF ıst und alle nıcht 
zum Schlüssel gehörenden Attribute voll funktional abhängig sind vom Schlüssel. 


Anmerkung: Somit kann die zweite Normalform nur dann verletzt werden, wenn eine 
Relation einen zusammengesetzten Schlüssel und (mindestens) ein weiteres, nicht zum 
Schlüssel gehörendes Attribut aufweist. 


Um die Tabelle aus dem Beispiel in zweite Normalform zu überführen, ıst eine Aufspaltung 
in zwei einzelne Relationen, wıe ım folgenden Beispiel gezeigt, erforderlich. 


Beispiel: Die folgenden Tabellen stellen Relationen ın zweiter Normalform dar. 


StudentNr StudFachNr Studienfach 


S1001 l Mathematik 
S1001 2 Physik 
S1002 l Mathematik 
S1002 2 Chemie 
S1003 l Jura 
StudentNr Name 
S1001 Meier, Gerda 
S1002 Müller, Erwın 
S1003 Weber, Karla 
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7.2.2.4. Dritte Normalform (3NF) 


Betrachten wır die folgende Tabelle. 


StudentNr StudFachNr Studienfach Fakultät 

S1001 1 Mathematik Naturwissenschaften 
S1001 2 Physik Naturwissenschaften 
S1002 l Mathematik Naturwissenschaften 
S1002 2 Chemie Naturwissenschaften 
S1003 1 Jura Sonstige Wissenschaften 
S1003 2 Mathematik Naturwissenschaften 


Dann sınd offensichtlich die Voraussetzungen der zweiten Normalform erfüllt. (Klar?) 
Gleichzeitig fällt auf, dass ein Eintrag der Form (S1004,1,Jura,Naturwissenschaften) 
theoretisch möglich wäre, obwohl wir inhaltlich feststellen können, dass dieser Eintrag nicht 
korrekt wäre, also semantische Inkonsistenz hervorrufen würde! 


Grund dafür ıst, dass das Nicht-Schlüssel-Attribut Fakultät funktional abhängig ıst vom 
Nicht-Schlüssel-Attribut Studienfach: es ıst beispielsweise klar, dass dıe Werte Mathematik, 
Physik und Chemie zur Fakultät Naturwissenschaften gehören. 


Um auch diesen Mißstand auszuschließen, wird die dritte Normalform wie folgt definiert. 


Eine Relation ist ın dritter Normalform (3NF), wenn jedes nıcht dem Schlüssel angehörende 
Attrıbut voll funktional abhängig ıst vom (Gesamt-)Schlüssel und es keine funktionalen 
Abhängigkeiten zwischen Nicht-Schlüssel-Attributen gibt. Anders formuliert: eine Relation 
ist 3NF, wenn sie 2NF ıst und keine sogenannten transitiven Abhängigkeiten besitzt. 


Beispiel: Aus obiger Tabelle werden durch Überführung in die dritte Normalform somit die 
folgenden beiden Tabellen. 


StudentNr StudFachNr Studienfach 
S1001 l Mathematik 
S1001 2 Physik 
S1002 l Mathematik 
S1002 2 Chemie 
S1003 l Jura 

S1003 2 Mathematik 
Studienfach Fakultät 

Mathematik Naturwissenschaften 
Physik Naturwissenschaften 
Chemie Naturwissenschaften 
Jura Sonstige Wissenschaften 


In der Praxis weniger relevant, theoretisch jedoch ebenfalls denkbar, sınd weitere 
Problemsituationen, dıe dıe vierte bzw. fünfte Normalform erforderlich machen (können). 
Der Vollständigkeit halber soll daher kurz auf die 4NF und die 5NF eingegangen werden, 
auch wenn man sıch in der Praxıs mit der dritten Normalform begnügt. 


= 217 - 


7.2.2.5. Vierte Normalform (4NF) 


Beispiel: Betrachten wir die folgenden beiden Relationen Spricht und Produziert. 


--------- -- -- -- +-------------------------------Spricht--- 
PERSONNR | SPRACHE 

BER ESSENER Me et 

101 | DEU 

101 | ENG 

102 | DEU 

102 |FRZ 

UIHERRURERTERHEENERUS EEEMEEN UREETEEN PR NUENTERTERSSPRRUREEIERERHERNE 

ee Er Eat +-----------------------------Produziert-- 
PERSONNR | PRODUKTNR 

ETTIRINNEENIENE Me te an Be en En nz 

101 11 

101 112 

102 111 

2092 113 

EEE KEINE PIE EEINENSERENE OREENNERGERFFERN 


Über diese beiden Relationen ist das Attribut PersonNr zweimal komplex assoziiert, d.h. zu 
einer PersonNr gibt es jeweils mehrere Attrıbutwerte von Sprache bzw. von ProduktNr. 


Über den natürlichen Verbund (natural join) dieser beiden Tabellen gelangen wir zu einer 
Relation Person, dıe ın der folgenden Aufstellung gezeigt wird. 


a nn EEE RR ee rer ern eaer PELSON > 
PERSONNR | SPRACHE | PRODUKTNR 
IREIERSERBUR-ALTCBIE Be een a Berner 
anojE | DEU aba 

101 | DEU 112 

101 | ENG 1 

101 | ENG 112 

102 | DEU 111 

102 |FRZ est 

102 | DEU 113 

102 |FRZ [13 
ERREREREEIERI ERRERERERERERRIERERSREREREREERR 


Beachten Sıe bitte, dass eines dieser Tupel nur durch Angabe aller drei Attribute 
herausgefiltert werden kann, also alle drei Attribute Schlüsselbestandteile sein müssen, 
wodurch automatisch auch die dritte Normalform sıchergestellt ıst. 


Weiterhin ıst festzustellen, dass für jede von einer Person (z.B. 101) gesprochene Sprache 
eine identische Menge von ProduktNr-Werten (hier 11 und 12) erscheint. Trifft eine solche 
Bedingung für jede Person zu, so spricht man davon, dass das Attrıbut ProduktNr mehrwertig 
abhängig (oder mengenwertig abhängig) ıst vom Attribut PersonNr. 


Entsprechend entdecken wir eine weıtere mehrwertige Abhängigkeit: für Jedes von einer 
bestimmten Person produzierte Produkt erscheint stets dieselbe Menge gesprochener 
Sprachen. Und so ıst das stets: mehrwertige Abhängigkeiten erscheinen ın einer Relatıon 
immer paarweise! 
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Angenommen, Person 101 produziert nıcht länger das Produkt Nr. 11, dann müssten die 
beiden Tupel (101,DEU,11) und (101,ENG,11) gelöscht werden. Aus der Relation Person 
kann aber, weil alle drei Attribute gemeinsam den Schlüssel bilden, ein einzelnes Tupel 
gelöscht werden, womit Person (inkonsistenterweise) nicht mehr länger die komplexen 
Assoziationen zwischen PersonNr, Sprache und ProduktNr ausdrücken würde. Ähnlich 
verhielt es sich bei dem Problem, neue Daten einzufügen, beispielsweise wenn Person 102 
zusätzlich Englisch lernt und notwendigerweise die beiden Tupel (102,ENG,11) und 
(102,ENG,13) eingefügt werden müssten. 


Diese Problembetrachtung führt zur folgenden Definition: Eine Relation ist ın vierter 
Normalform (4NF), wenn sıe 3NF ıst und keine mehrwertigen Abhängigkeiten besitzt. 
7.2.2.6. Fünfte Normalform (5NF) 


Beispiel: Betrachten wir die modifizierte, aus obiger Relation Person abgewandelte Relation 
Person2. 


a an Peeessspgesestiegleseiseeza2ec@2zerBerson2-== 
PERSONNR | SPRACHE | PRODUKTNR 

RRIIEHREE EP IRERENTE Beate ee Su ee 

101 | DEU able 

101 | DEU 12 

101 | ENG 111 

101 | ENG 112 

102 | DEU 111 

102 |FRZ Bl 

102 | DEU 113 


Gegenüber der Relation Person wurde also lediglich das Tupel (102,FRZ,13) entfernt. Damit 
ist erkennbar, dass mit einer Zerlegung der Relation Person? ın dıe zwei durch Projektionen 
(vgl. Abschnitt 7.1.6.4. auf Seite 210 auf jeweils zwei Spalten entstandenen Relationen 
Spricht(PersonNr,Sprache) und Produziert(PersonNr,ProduktNr) die ursprüngliche Relation 
Person? nıcht mehr rekonstruiert werden kann. Dies liegt daran, dass der natürliche Verbund 
der Relationen Spricht und Produziert zu einem Tupel führt, das ın Person2 nıcht (mehr) 
enthalten ist. 


Wird dagegen die Relation Person2 ın die drei Projektionsrelationen Spricht(PersonNr, 
Sprache), Produziert(PersonNr, ProduktNr) und Spr-Prod(Sprache, ProduktNr) zerlegt, so ıst 
(über einen zweıstufigen natürlichen Verbund) die Ausgangsrelation Person2 wieder 
eindeutig rekonstruierbar. 


219 - 


PERSON2 Illustration zur 5.Normalform 
101, DEU, 11 


1:02;: DEU,.. 22 
101;- ENG, 11 
101,;-ENG,. 12 
102. DEU, 11 
102; ERZ, 11 
102, "DEU; 13 


Projektionen führen zu den Relationen SPRICHT, PRODUZIERT und SPR-PROD ... 


SPRICHT PRODUZIERT SPR-PROD 
101,DEU 1097,21 DEU; 11 
101,ENG 192, 22 DEU, 
102,DEU 1:92,. 11 ENG, 
102,FR2Z 102, 23 ENG, 
DEU, 
FRZ, 


Der natürliche Verbund von SPRICHT und PRODUZIERT führt zur Relation PERSON ... 


PERSON 

10%..7DE% 
10%, DEU, 
10:55: ENG, 
101, ENG, 
1925. :DEU, 
1:02>-.DEU; 
1025: ER, 
1:02, 'ERZ; 


Der natürliche Verbund von PERSON und SPR-PROD schließlich führt zu PERSON2 


PERSON2 

1202-; ‚DEU, 
1705; -DEU,; 
101, ENG, 
101, ENG, 
1:02, DEU; 
1092, !ERZ, 
1025: DEU; 


Bild: Illustrierendes Beispiel zur 5.Normalform 


Das hier aufgeführte Beispiel der Relation Person2 kann (prinzipiell) in der Praxis zu 
Speicheranomalıen führen, so dass es (theoretisch) einleuchtend erscheint, auch die fünfte 
Normalform (nach [Vetter]) zu definieren: 


Eine Relation ıst ın fünfter Normalform (5NF), wenn sıe unter keinen Umständen aufgrund 
einer Verschmelzung einfacherer, d.h. weniger Attrıbute aufweısender, Relationen mit 
unterschiedlichen Schlüsseln konstruiert werden kann. 


Allerdings geben auch diejenigen Autoren, dıe dıe SNF erstmals definiert haben, zu, dass es 
ın der Praxis häufig nur sehr schwer herauszufinden ist, ob eine Relatıon dıe SNF erfüllt oder 
nıcht. Generell wird davon ausgegangen, dass (3NF- oder 4ANF-JRelationen, die dıe SNF 
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verletzen, eher konstruierte Beispiele sind und ın der Praxis nur sehr selten vorkommen. 
Dieser Hoffnung wollen wir uns ım Folgenden einfach anschließen. 


7.2.3. Integrität 


Um einen Datenbestand widerspruchsfrei zu halten, ıst ebenfalls auf die sogenannte /niegrität 
zu achten. Man unterscheidet dabei häufig drei Arten von Integrität: 


e  Entity-Integrität 
° Referentielle Integrität 
°e  Benutzerdefinierte Integrität (Semantische Integrität) 


Dabei sollte ın der Praxıs das Datenbank-Managementsystem dafür sorgen, dass 
weıtmöglichst alle Integritäten automatisch überwacht werden; wo dies nicht möglich oder zu 
umständlich ıst, müssen eigene Zugriffsprozeduren (Eingabe-, Lösch- und Veränderungs- 
routinen) für die Einhaltung der Integritätsbedingungen sorgen. 


7.2.3.1. Entity-Integrität 


Entity-Integrität bedeutet, dass die Primärschlüssel keine NULL-Werte annehmen können 
bzw. dürfen. Dies entspricht der Tatsache, dass Entities wohlunterscheidbare Objekte der 
realen Welt darstellen, also insbesondere eindeutig ıdentifizierbar sein müssen. 


7.2.3.2. Referentielle Integrität 


Korrespondiert ein Fremdschlüssel X einer Relation RI mit dem Primärschlüssel Y der 
Relation R2, so muss jeder Wert von X in Rl auch ın Y bei R2 vorkommen oder er muss 
(insgesamt) ein NULL-Wert sein. Mit anderen, vielleicht verständlicheren Worten: ıst beı 
einem Fremdschlüssel ein Eintrag vorhanden, so muss der Bezug, der dadurch hergestellt 
wird, ın einer anderen Relatıon auch erfüllt bzw. aufgelöst werden. 


Beispiel: Taucht ın einer Relation RI zu einem Angestellten als Fremdschlüssel die 
Mitarbeiternummer seines Vorgesetzten auf, so muss es natürlıch zwingend die dort 
eingetragene Mitarbeiternummer (des Vorgesetzten) entweder im Mitarbeiterstamm auch 
geben, oder aber bei der Mitarbeiternummer des Vorgesetzten steht ein NULL-Wert, d.h. der 
Angestellte hat (derzeit) keinen (direkten) Vorgesetzten. 


7.2.3.3. Benutzerdefinierte Integrität (Semantische Integrität) 


Neben den o.g. Integritäten kann es auch noch weitere, inhaltliche Bedingungen geben, die 
jederzeit erfüllt sein müssen, damit der Datenbestand konsistent und sinnvoll ıst. So kann es 
für den konkreten Betrieb z.B. festgelegt sein, dass bei den Mitarbeiternummern die 
Angestellten mit einer führenden 1, die Arbeiter/innen mit einer führenden 2 und die 
Leitenden Angestellten mit einer führenden O (!) gekennzeichnet werden. Diese Vorgabe 
auch einzuhalten, wäre ein Beispiel einer benutzerdefinierten oder semantischen Integrität. 
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7.2.4. Beispiel zum Datenbankentwurf: die Datenbank Auftrag 


Im Folgenden werden wır anhand des Beispiels der Datenbank Auftrag die Schritte, die beim 
Datenbankentwurf notwendig sind, durcharbeiten. 


Nehmen wiır an, Sıe speichern alle Kunden-, Bestell- und Artikeldaten ın einer einzigen 
Tabelle''”, so müssen Sie bei Bestellungen von unterschiedlichen Kunden jeweils alle 
Bestell- und Artikeldaten nochmals erfassen. Bestellt dagegen eın Kunde mehrmals, so 
wıederholt sıch zwangsläufig die Eingabe aller kundenspezifischen Daten. 


In der folgenden Abbildung wiederholen sich so dıe Bestellungen der Artikel mit den 
Artikelnummern 5534 (Damenhose) und 6643 (Sweatshirt) und die Angaben z.B. zu dem 
Kunden „A & B”. (Abgesehen davon hat dieser Kunde zwei verschiedene Kundennummern 
erhalten, aber das ıst ein anderes Problem.) 


TalNı 


A | = 
Ss. 


ala Ps 


= | F a ( I 
Kirz3 |=enze und Fartner |Möhlerwweg ', bICKY Kodr MchzeilFekach ZU rHHSHHIIBEd Sb Syweatshrr u - 
Una: alalf El .; ä "| 


Bild: Tabelle Kunde mit allen Kunden- und Bestelldaten 


Aus den genannten Gründen ist für eine professionelle Datenhaltung die hier gezeigte Tabelle 
Kunde nicht sehr sınnvoll. Die Probleme bei der Datenbearbeitung dieser Tabelle zeigen sıch 
insbesondere, wenn eine Bestellung gelöscht oder eine Artikelbezeichnung geändert werden 
soll. 

Falls Sıe eine Bestellung löschen, dann löschen Sıe gleichzeitig die dazugehörigen 
Firmendaten. Hat ein Kunde keine weiteren Bestellungen getätigt, so gehen dıe Firmendaten 
endgültig verloren. Und ändert sıch der Artikelname (z.B. Damenschuhe in Damenstiefel), so 
müssen manuell alle Datensätze geändert werden, ın denen dieser Artikel vorkommt. 


Ziel eines optimalen Datenbankentwurfs ist es natürlich, die Tabellen so zu strukturieren, 
dass sıch einerseits Informationen (in der Regel) nıcht wiederholen, trotzdem aber alle 
relevanten Informationen aus den Tabellen gelesen werden können. 


Durch die Normalisierung (vgl. Abschnitt 7.2.2. auf S. 214 ff) soll erreicht werden, dass 
keine Datenredundanz auftritt und trotzdem alle Informationen aus den Tabellen abrufbar 
sind. Um dieses Ziel zu erreichen, wırd die Normalısierung stufenweise durchgeführt. 


Wir erinnern uns (?): eine Tabelle befindet sıch nur dann ın der I. Normalform (INF), wenn 
in jedem Feld nur eine einzige, elementare Information steht. 


In unserem Beispiel ıst die Tabelle Kunde nicht ın der 1. Normalform, da das Feld Adresse 
mehrere Informationen aufweist, nämlich die Informationen Straße, Postleitzahl und Ort. 


Wir bringen diese Tabelle ın die 1. Normalform, indem wir das Feld Adresse ın dıe Felder 
Straße, PLZ und Ort aufteilen. Nach dieser Normalisierung ıst jedem Feld nur jeweils eine 
Information zugeordnet. 


19 Wie bereits erwähnt: dies könnten Sıe bei einem nicht zu großen Datenumfang auch noch in einer 
Tabellenkalkulationssoftware wıe Excel oder Lotus 1-2-3 realisieren. 


22228 


EITEIEI änspiechpaliner | Talk 


Same ? 1)35 Ihr Lamee Mfkerdinck (278 b’H 


LuHxi ’ 
ÄAen2c ndParneı )Maıkenweag ? ISICHB TH 


| Dateesarı Inlall = s [ralrel ms 


Bild: Tabelle Kunde ın 1.Normalform 


Aber: Die Tabelle (in INF) enthält Redundanzen. Bestellt ein Kunde mehrere Artikel, so 
müssen jedesmal alle Kundendaten gespeichert werden! 


Die Tabelle in der I. Normalform enthält zwar ın jedem Feld nur noch eine einzige, 
elementare Information. Aber es können sog. Anomalıen oder Inkonsistenzen auftreten. 
Ändern Sie beispielsweise im ersten Datensatz für den Artikelnamen Damenhose die 
dazugehörige Artikelnummer und vergessen diese Änderung im fünften Datensatz, in dem 
dieser Artikel mit der dazugehörigen Artikelnummer ebenfalls zu finden ist, so treten 
Unstimmigkeiten auf, da dem Artikelnamen Damenhose unterschiedliche Artikelnummern 
zugeordnet sınd! Noch eine Inkonsistenz: bei dem Kunden „A & B” ıst einmal eın 
Ansprechpartner eingetragen, ein zweites Mal nicht. 


Dieses Problem trıtt deswegen auf, weil die Tabelle gleichzeitig verschiedenartige 
Informationen (Kundendaten, Bestelldaten, Artikeldaten) enthält, diese aber unabhängig 
voneinander geändert werden können. 


Eine Relation befindet sich, wie bereits definiert, dann in zweiter Normalform (2NF), wenn 
jedes nıcht zum Schlüssel gehörige Attrıbut funktional abhängig ıst vom Gesamtschlüssel, 
nıcht aber von Schlüsselteilen. 


Der Schlüssel bei der hier gezeigten Tabelle Kunde ist dreiteilig und besteht aus KdNr, 
BestNr und ArtNr. (Wieso?) Aber: dıe Attrıbute Fırma, Strasse, PLZ, Ort, Ansprechpartner 
und TelNr hängen nur von dem Teilschlüssel KdNr ab. 


Wir müssen also für dıe 2.Normalform die Tabelle Kunde zerlegen: ın eine neue Tabelle 
Kunde, ın der nur von KdNr abhängige Attribute gespeichert werden, eine Tabelle Artikel 
(mit dem Artikelnamen) sowie eine Tabelle Bestellung, ın der zu einer Bestellung gehörende 
Angaben verwaltet werden. 


Kunde(KdNr, Firma, Strasse, PLZ, Ort, Ansprechpartner, TelNr)'” 
Artikel(ArtNr, ArtName) 


Bestellung(BestNr, KdNr, ArtNr, Menge) 


Die Attrıbute KdNr und ArtNr werden hier als Fremdschlüssel bezeichnet, denn es handelt 
sıch dabeı ınhaltlıch um Schlüsselattrıbute ın anderen Tabellen. 


12° Die Schlüsselfelder sınd ın dieser Darstellungsform unterstrichen markiert. 
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„lEOlx! 


4, Microsoft Access 
Datei Bearbeiten Ansicht Eirdügen Forma Datenpäize Eıtras Eeriter ? 
"220 = IE ne ti Ta Ar DBA- ZT 


m aullıag : Datenbank 


El Tabeben | Elatiregen | EM former | MB Derchte | Mares | äh Moe | 


Mm Aue: T akselle 


I Eye vet 
6643 Seeatshrt 100 
Datensatz: 14 | « a u Fall) 220 9321 100 _ 
1303 254 re 200 
| 1590 310 0943 500 | 
1] 1824 793 654 200 | = 


Dakersatz: alalf 5 #lslselvens 


m Kunde: Takıelle 


KdNr Firma PLZ Ort Ansprechpartner 
al: Meierdinch Waldweg 3 50735 Köln Gabnele Meserdinck| 0221 77 
2 2 |Grubersöhne Feldgssse 17 50998 Kaln Stefan Pu» 0221 7 800201 
- 2 ABB Bahnhüfstr 2 51465 Bergisch Gladbach Hans Meschner 02202 889723! 
'Es10 A&B Bahnhofstr. 251465 Bergisch Gladbach 
A 43 Henze und Partner |Mühlenweg ? 51069 Kaln Michael Rebach 0221 69906 
Detwestz: TE ir ir#l von 5 
“| | +) 
Datenbiattansach nr 


Bild: Die dreı Tabellen Kunde, Artıkel und Bestellung (2.Normalform) 


Wenn wır ın dıe Tabelle Bestellung noch zwei weitere Attribute aufnehmen, Zahlungsart 
(z.B. „bar”, „Scheck”, „Uberweisung”) und Zahlungskennzeichen (als Kurzform für die 
Zahlungsweise, dann haben wir die im folgenden Bild gezeigte Situation. 


ES Bestellung : Tabelle 


> 
1 Besttir TKalır | _Antir Menge |Zahlungsken Zahlungsar] = 
am fr fs mn u 
aa a sche | 
is en Überweisung] 
iss j200 aan mn ja [Übenmeisun 
22 es Be — 2 nei 
LG 


aeRz 14 | 4 “ > |»ı - von 5 


Bild: leicht modifizierte Tabelle Bestellung 


O)|O) 


NI 


In diesem Fall müssen wır feststellen, dass das Zahlungskennzeichen bereits ausreicht, um 
über dıe Zahlungsart Auskunft zu geben. Anders formuliert: ın der hier gezeigten Form kann 
Inkonsistenz dadurch auftreten, dass zu einem Zahlungskennzeichen eın ıinhaltlıch falscher 
Wert für dıe Zahlungsart eingetragen werden kann. Gleichwohl ıst die Tabelle ın 
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2.Normalform, denn der Schlüssel ıst elementar (und damit die Bedingung der 2NF 
automatisch erfüllt). 


Diese Tabelle erfüllt Jedoch nıcht die 3.Normalform, denn es gibt ein Attrıbut (Zahlungsart), 
das bereits von dem Nicht-Schlüssel-Attribut Zahlungskennzeichen funktional abhängig ist. 


Wieder muss also eine neue Tabelle ausgelagert und die Tabelle Bestellung verändert werden 
wiıe folgt. 


Bestellung(BestNr, KdNr, ArtNr, Menge, Zahlungskennzeichen) 


Zahlungsart(Zahlungskennzeichen Zahlungsart) 


Mit den so erhaltenen vıer Tabellen haben wır das Problem normalisiert, dıe Tabellen liegen 
in 3.Normalform vor. 


Anmerkung: Beachten Sıe bitte, dass gleichwohl das Phänomen, dass ein und derselbe Kunde 
mit verschiedenen Kundennummern in den Datenbestand aufgenommen wurde, mit den hier 
vorgestellten Mitteln nıcht beseitigt werden kann! Hierbei handelt es sıch nämlich nıcht um 
einen Widerspruch innerhalb des Datenbanksystems sondern um Semantik, also den vom 
Benutzer inhaltlich definierten Wunsch, dass ein bereits eingetragener Kunde nicht eın 
zweites Mal separat aufgenommen werden soll. Dies kann zum Beispiel mit speziellen 
Eingaberoutinen, die man innerhalb des Datenbanksystems definieren kann, überprüft 
werden. 
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8. INTERNET 


Zum Thema /nternet gıbt es eine große Zahl von Dokumenten ım Internet selbst, die dieses 
erläutern. Einige Erläuterungen werden ım Folgenden gegeben, diese sollten jedoch durch 
tagesaktuelle Informationen direkt aus dem Internet ergänzt werden. 


Daneben seı auf ein kleines Büchlein von [Tolksdorf] verwiesen, das grundlegende 
Informationen zum Aufbau und den Diensten des Internet liefert. 


8.1. Historie 


Das Internet hat seinen Ursprung im US-amerikanischen militärischen Sektor gegen Ende der 
sechziger Jahre. 1957 wurde die ARPA (Advanced Research Project Agency) gegründet zu 
einer Zeit, ın der ein starkes Gefühl der Bedrohung durch die Sowjetunion bestand. Es war 
die Zeit des Kalten Krieges. 


Das so entstandene ARPAnet wird als „Mutter des Internet” angesehen. Zwischen 1964 und 
1972 wurde die paketvermittelte Übertragung entwickelt, d.h. Informationen werden in 
einzelne Päckchen aufgeteilt, die je nach Übertragungsprotokoll auch auf physikalisch 
vollkommen unterschiedlichen Wegen den Empfänger erreichen können. Für den Fall, dass 
ein Teıl der Leitungen der Computer untereinander zerstört wären, könnten die Pakete doch 
noch den Empfänger erreichen. Dies war sehr wichtig für dıe militärische Kommunikation 
ım Kriegsfall. 


1969 wurden die ersten vier Knotenrechner des ARPAnet vom Department of Defense (DoD) 
zusammengeschaltet. Um eine Kommunikation auch noch bei einer teilweisen Zerstörung des 
Kommunikationsnetzes zu gewährleisten, wurde, anders als beim Telefon, keine 
Sterntopologie, sondern Ringvernetzung (Maschen) bevorzugt. 


Ein weıterer Grund, dieses Netz aufzubauen, war die verstärkte Nachfrage der 
Wissenschaftler nach damals extrem teuren Computerresourcen. Es sollte die Möglichkeit 
geschaffen werden, Forscher mit entfernten Computerzentren zu verbinden, dıe ıhnen einen 
Zugriff auf die Hardware- und Softwareresourcen erlaubte. Wenn der Plattenplatz, dıe Daten 
und auch die Rechenleistung der Computer gemeinsam benutzbar wurden, konnten diese 
Resourcen besser ausgenutzt werden. 


Bis 1972 wurden auch die ersten Entwicklungen der heute Standard gewordenen 
Protokollfamilie TCP/IP (Transmission Control Protocol / Internet Protocol) spezifiziert und 
programmiert. 


Zwischen 1974 und 1982 entwickelten sıch parallel hierzu auch ın Europa diverse Netze, z.B. 
dıe Netzwerke des Hahn-Meitner-Institutes Berlin (HMI-Net I und II) oder das BerNet; diese 
mündeten ın das Deutsche Forschungsnetz DFN. 


Ende der siebziger Jahre entstanden dann das Unix-to-Unix-Communicatıons-Protocol 
(UUCP) und das Usenet. 


1981 begannt das BITNet (Because it’s time-Network) als kleines Netzwerk von 
IBM-Computern an der City University of New York (CUNY), das sıch sehr schnell über dıe 
ganze Welt ausbreitete. 
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Nachdem die Kommunikation innerhalb eines Netzwerkverbundes ım wesentlichen gelöst 
war, ging es anschließend um die Vernetzung der Netze. 


1982 schlossen sıch vier experimentelle Netze zum sog. Internetting Project zusammen, das 
bereits Internet genannt wurde. Diese waren ein paketvermitteltes Satellitennetz, eın 
paketvermitteltes Funknetz, das ARPAnet und ein Ethernet beim XEROX Research Center ın 
Palo Alto. 


Ebenfalls 1982 wurde die erste Distribution des 4.2 BSD Unix (Berkeley Systems 
Distribution) mit integriertem TCP/IP kostenlos von der University of Berkeley zur 
Verfügung gestellt. Auch deshalb kam es zu einer sehr schnellen Verbreitung an den 
Universitäten und unter den Studenten. 


1983 spaltete sich das militärische MilNet vom ursprünglichen ARPAnet ab. Alle 
Knotenrechner sollten nun TCP/IP benutzen. Die Kontrolle ging an die DCA (Defense 
Communication Agency), heute bekannt unter DISA (Defense Information Systems Agency). 
Die beiden Netze blieben jedoch untereinander verbunden, und diese Verbindungen 
bekamen den Namen the DARPAÄ Internet, was später zum Namen Internet verkürzt wurde. 
Über Satelliten waren schon damals Verbindungen ins europäische Ausland geschaffen 
worden. Hier spielte Skandinavien eine besondere Rolle. Durch das Nordunet wurde die 
Anbindung von Finnland aus über ganz Skandinavien verteilt. Auch heute noch ist 
Skandinavien (und insbesondere Finnland) ein besonders aktiver Teıl des Internet. 


Mitte der 80er begann auch dıe amerikanische National Science Foundatıon (NSF) Interesse 
am Internet zu zeigen. Um den Wissenschaftlern aller amerikanıschen Universitäten den 
Zugang zum Netz zu ermöglichen, gründete sıe das NSFNET. Um immer mehr Institutionen 
anzuschließen und einem NSFNET immer weiter zunehmenden Verkehr gerecht zu werden, 
wurde ein System, basierend auf Backbones (=Rückgrat) realisiert, das dıe großen 
Rechenzentren miteinander verband. An diese konnten sich andere eigenständige Campus- 
und Weitverkehrsnetze (WAN, Wıde Areas Networks) anschließen. Dieser Backbone trägt 
heute mit seinen 45 Mbit/s-Anschlüssen dıe Hauptlast des Internetverkehrs. Damit übernahm 
dıe NSF immer mehr dıe Aufgaben des Arpanet, das schließlich Ende 1989 vom Department 
of Defense aufgelöst wurde. 


1986 entstand der DNS-Namensraum (DNS = Domain Name System), der eine für damalige 
Verhältnisse sehr große Zahl von Rechnern adressıeren konnte (bzw. kann). 


1993 entstand beim CERN (Centre Europeen de Recherche Nucleaire) ın Genf das World 
Wide Web (WWW), das heute aufgrund seiner bunten Bildchen auch Neulingen mit 
entsprechenden Browser-Programmen offensteht und für viele als „das Internet” schlechthin 
gilt. 


8.2. Dienste des Internet 


Wir wollen zur Entspannung, bevor wir mit der Aufzählung der wichtigsten Dienste des 
Internet fortfahren, mit einigen, zum Teil schon etwas älteren, Presseschnipseln beginnen, dıe 
den Facettenreichtum des Internets belegen sollen. 


° Seattle (dpa, Juni 1997) - Eın kalıfornischer Jungunternehmer, dessen Fırma ım Internet 
unter der Adresse www.microsoftnetwork.com residiert, soll seine Adresse ändern. Das 
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verlangt der Softwarehersteller Microsoft aus Redmond bei Seattle (US-Bundesstaat 
Washington), dessen Sprecher am Dienstag betonte, es liege "ein bewusster Versuch zur 
Taeuschung von Internet-Nutzern vor." 

Der kalifornısche Unternehmer hatte den umstrittenen Namen zusammen mit anderen, die 
an Microsoft-Produkte erinnern, bei einem Händler erworben, der werbeträchtige 
Online-Adressen verkauft. 

Hinter der von Microsoft kritisierten Adresse steckt eine von Bill Gates’ Unternehmen 
unabhängige Firma, dıe dıe Herstellung und Betreuung von Webseiten anbietet. Der 
Besitzer der "Global Net Web Site Construction Company" ıst ein kalıfornıscher Student. 


Düsseldorf (dpa, Juni 1997) - Die Deutschen hinken nach Angaben des Bundesverbandes 
des Groß- und Aussenhandels (BGA) beı der Nutzung moderner Kommunikations- 
techniken hinterher. 

Nur drei von 1 000 Deutschen hätten beispielsweise einen Internet-Anschluss. In den 
USA seıen es dagegen mit zwölf Einwohnern viermal so viele. Selbst das kleine Island 
seı Deutschland mit 18 Internetanschlüssen je 1 000 Einwohner um Längen voraus. Diese 
Zahlen nannte BGA-Präsident Michael Fuchs beı einem Kongreß ın Düsseldorf. 

Fuchs machte die Abschottung des deutschen Kommunikationsmarktes und überhöhte 
Preise dafür verantwortlich. In den USA zahlten Bürger für einen pauschalen 
Internet-Zugang 20 Dollar. Dafür könne ein deutscher Internetnutzer gerade einmal drei 
Stunden "surfen". 

BGA forderte, den deutschen Telekommunikationsmarkt konsequent zu lıberalisieren und 
mehr Wettbewerb zu ermöglichen. Auch die Tarıfparteien müssten sıch auf die neue 
Arbeitsformen ın den Zukunftsbranchen einstellen. Fuchs bekräftigte seine Forderung, 
Löhne und Gehälter nach unten zu Öffnen, um so Jobs für weniger qualıfızıerte 
Dienstleistungen zu schaffen. "Es ıst doch besser, überhaupt einen Job zu haben als gar 
keinen. Uns geht ın Deutschland die Arbeit nicht aus. Sıe ıst einfach nur zu teuer." Auch 
müssten dıe Unternehmen die Arbeitszeit wählen können, die sıe bräuchten. 


Frankfurt/Main (dpa, Junı 1997) - Mehrere Tausend Reiselustige haben sich ın einem 
"virtuellen Auktionsraum" an der ersten Flugticket-Auktion der Lufthansa ım Internet 
beteiligt. Rund 7000 Interessenten hatten sıch für dıe Aktion registriert, bei der die 
Lufthansa an zweı Tagen insgesamt 66 Flugscheine unter den elektronischen Hammer 
bringen will. 

Die Fluggesellschaft möchte mit diesem Marketing-Instrument ıhren "Infoflyway" mit 
der Möglichkeit zum Buchen ım Internet bekannter machen. Längerfristig sollen für die 
Aırlıne dabeı kräftige Einsparungen herausspringen. Bisher ıst dıe Zahl der 
Online-Buchungen noch relativ gering: Zwischen dem Start im November 1996 und März 
1997 wurden nach Angaben der Aırline rund 10 000 Flugscheine auf diese Weise 
geordert. Lufthansafhttp://www.lufthansa.com) ıst damit jedoch nach eigenen Angaben ın 
Europa Marktführer, wobeı International derzeit nur "eine Handvoll" Aırlınes diesen 
Service anböten. 

"Überwältigend" war nach Angaben der Lufthansa-Sprecherin Dagmar Rotter der 
Andrang bei der Ticket-Versteigerung ım Internet. Die Teilnehmer konnten sıch für eın 
Mindestgebot von zehn DM am Computer per Mausklick an der Ersteigerung beteiligen. 
Die Liste der Ziele enthielt exotische Orte wıe Bangkok, Johannesburg, Kuala Lumpur 
oder Sıngapur genauso wie dıe näherliegenden Amsterdam, Parıs oder Rom. Nach 
Angaben Rotters konnten die ersten Gewinner "echte Schnäppchen" machen, dıe zum 
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Teil weniger als die Hälfte des günstigsten derzeit am Markt gehandelten Ticketpreises 
betrugen. 

Eine höhere Zahl von Online-Buchungen soll Lufthansa Einsparungen unter anderem ım 
Marketing, bei den Reisebüro-Provisionen und im Service-Bereich bringen. Über die 
Höhe schweigt sıch die Aırlıine - mıt dem Hinweis auf das Interesse der Konkurrenz - 
allerdings aus. Genutzt werde das Medıum vermutlich vorwiegend von Geschäftsleuten. 
Business-Class-Tickets machten rund 60 Prozent der so verkauften Flugscheine aus. 


Berlin (dpa, Junı 1997) - Die positive Wirtschaftsentwicklung der Hard- und 
Softwarebranche darf nach Ansicht der Hersteller nicht durch das geplante Gesetz zur 
Verhinderung von Datenverschlüsselung beeinträchtigt werden. Ein solches Gesetz sei 
der kostspielige Versuch, "zu kontrollieren, was faktisch nıcht zu kontrollieren ıst", sagte 
der Vorsitzende des Fachverbandes Informationstechnik im VDMA und ZVEI, Jörg 
Menno Harms, am Donnerstag in Berlin. Bundesinnenminister Manfred Kanther hatte 
Ende April angeregt, für elektronische Netze wie das Internet eine Überwachung zu 
ermöglichen. 

Die Nutzung von Verschlüsselungen, sogenannter Kryptographie, ın Datennetzen lasse 
sich zwar einschränken, der kriminelle Mißbrauch allerdings nicht, meint der 
Fachverband. Den Preis einer Regulierung hätten die deutsche Wirtschaft und die 
Privatanwender zu zahlen. Denn sıe müssten eine aufwendige Infrastruktur zur 
Schlüsselarchivierung finanzieren. Stellen, bei denen Entschlüsselungs-Code hinterlegt 
werden, seien lohnende Angriffsziele zum Beispiel von ausländischen 
Nachrichtendiensten. 

Die organısierte Kriminalität werde vorhandene Umgehungsmöglichkeiten nutzen, heißt 
es. Denn ım Gegensatz zum Telefonverkehr könne ım Internet mit zweı Mausklicks eın 
wirksamer aber unbemerkter Schutz gegen Überwachungsmaßnahmen installiert werden. 
Geheime Botschaften seien ın Bild-, Fılm- oder Musikdateien sowie ım elektronischen 
Rauschen praktisch unauffindbar zu verstecken. 

Die Branche befürchtet zudem, dass der lukrative Zukunftsmarkt des elektronischen 
Handels durch falsche Rahmenbedingungen beeinträchtigt werden könnte. Ohne 
Beeinträchtigungen seı mit einem Marktwachstum von derzeit 1,6 Milliarden DM auf 14 
Milliarden DM ım Jahre 2000 zu rechnen. 

Die Informationstechnik ın Deutschland verzeichnet weiterhin gute Zuwachsraten. Der 
heimische Markt für Hard- und Software und Dienstleistungen stieg 1996 um fünf 
Prozent auf 80,5 Milliarden DM. Für das laufende Jahr werde aufgrund einer steigenden 
Nachfrage ım Service-Bereich mit einem Plus von sechs Prozent auf 85,6 Milliarden DM 
und 1998 mit einer siebenprozentigen Steigerung auf 92 Milliarden DM gerechnet. Der 
Wegfall europäischer Importzölle am 1. Julı 1997 fuer Deutschland ım Wert von 650 
Millionen DM kann laut Fachverband bei PCs und Druckern langfristig zu 
Preissenkungen zwischen drei und fünf Prozent führen. 


(com! Newsflash, Januar 1998) T-Onlıne hat das Jahr 1997 mit einem Rekordwachstum 
von ueber 550.000 neuen Teilnehmern abgeschlossen. Damit hat der Online-Dienst der 
Deutschen Telekom jetzt ueber 1,9 Millionen Kunden und ist nach eigenen Angaben der 
mitglieder- und wachstumsstaerkste Online-Service ın Deutschland. Alleın ım zweiten 
Halbjahr 1997 wurden ueber 350.000 Neukunden gewonnen. Das durchschnittliche 
Monatswachstum lag 1997 bei 45.000 neuen Teilnehmern - sıcher auch eın Verdienst der 
agressiven und flaechendeckenden Werbekampagne. Im Dezember 1997 erreichte die 
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Zahl der Verbindungen mit ueber 52 Millionen einen neuen Hoechstwert. Die 
Gesamtzahl der Verbindungen lag 1997 sogar bei rund einer halben Milliarde. 
Gegenueber dem Vorjahr bedeutet dies ein Wachstum von 60 Prozent. Die Zahl der 
Online-Konten hat sich fast verdoppelt: Waren es 1996 noch 1,8 Millionen, so werden 
aktuell bereits rund 3,5 Millionen elektronische Bankkonten gefuehrt. 


e (Auszug einer Greenpeace-Presseerklärung, 29.01.1998) Landentsorgung der "Brent 
Spar" ıst Praezedenzfall 
By email: From: redaktion@greenpeace.de - Date: Thu, 29 Jan 1998 12:06:36 +0100 
(MET) 
Proteste haben ıhr Ziel erreicht - Greenpeace fordert jetzt generelles Versenkungsverbot 
Hamburg, 29.1.98: "Die Vernunft hat gesiegt", sagt Birgit Radow, Geschaeftsfuehrerin 
von Greenpeace Deutschland zur heutigen Entscheidung von Shell, die "Brent Spar" an 
Land zu entsorgen. 
"Auf diese Shell-Entscheidung haben wir seit zweieinhalb Jahren gewartet. Der 
Beschluss von Shell bestaetigt, dass dıe durch Millionen Menschen unterstuetzten 
Greenpeace- Aktionen gegen die Versenkung der "Brent Spar" richtig waren. Die 
Entscheidung ist ein Erfolg fuer den Schutz der Meere und ein erster Schritt hın zu einem 
generellen Versenkungsverbot von Oelplattformen." 
Shells heutige Entscheidung ıst ein Praezedenzfall, bestaetigt Greenpeace. "Das setzt das 
richtige Signal, denn ueber vierhundert Plattformen in Nordsee und Nordostatlantik 
werden ın den naechsten Jahrzehnten ebenfalls entsorgt werden muessen",sagt 
Greenpeace-Oelexperte Christian Bussau. "Jetzt sind Shell, Esso, BP und die anderen 
Oelfirmen gefordert, detaillierte Plaene fuer die Landentsorgung dieser vıelen 
Plattformen auf den Tisch zu legen." (...) '*' 


° (telepolis, Januar 1998) Internet-Sucht und die Studenten (von Florian Roetzer 26.01.98): 
Internet hält die Studenten vom Arbeiten ab. 
Eine Untersuchung aus England, veröffentlicht ın einer neuen Zeitschrift, dıe sich der 
Psychologie und dem Verhalten im Cyberspace-Zeitalter widmet, warnt davor, dass das 
Internet auf das Studium einen schlechten Einfluß haben könnte. 
(Der ganze Artikel kann beı Telepolis unter der Adresse http://www.heise.de/tp/deutsch/ 
ıinhalt/glosse/2254/1.html angesehen werden.) 


Sehen wir uns im Überblick einmal die wichtigsten Dienste an. Ähnliche und umfangreichere 
Übersichten gibt es im Internet zahlreiche; exemplarisch seien hier die Links bei DINO 
online [DINO] erwähnt. 


8.2.1. Elektronische Post (electronic mail) 


Electronic Mail (elektronische Post) stellt einen der wohl wichtigsten und am meisten 
benutzten Netzwerkdienste dar, nämlich dıe Möglichkeit, auch über große Entfernungen und 
verschieden Zeitzonen hinweg relativ schnell und sicher zu kommunizieren. Analog zur 
Briefpost werden hierbei Empfänger und Absender einer Nachricht über eine Adresse 
identifiziert. Diese setzt sich wıe folgt zusammen: nutzername@domain-name Hierbei 


12! Da bei elektronischer Mail beim Wechsel zwischen den verschiedenen Rechnersystemen Umlaute nicht immer sauber 
oder eben gar nıcht konvertiert werden, schreiben viele Insider” (so wıe hıer die Greenpeace-Aktivisten ın ihrer Mail) 
statt ,„ä” „ae” usw. 
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wird der Nutzername ın vielen Mehrbenutzersystem mit dem Login-Namen gleichgesetzt, 
während der Domain-Name das Internet-Interface der entsprechenden Maschine, auf der der 
Empfänger die Nutzerkennung innehat, spezifiziert. 


Wie schon erwähnt, können Gateways zu anderen Netzen außerhalb des Internet 
angesprochen werden, so dass der Dienst E-Mail bei weitem nıcht nur eın Internetdienst ist. 
Es existieren zwei Möglichkeiten, um Post ın Netze außerhalb des Internet zu schicken. 
Zum einen können viele Gateways zu fremden Netzen als Hıgh-Level Domain angesprochen 
werden. Entsprechend wird eine Mail ın folgendem Format adressiert: 
nutzername@fremdnetz-maschinenname.fremdnetz 


In einer E-Mail werden ın der Regel textuelle Nachrichten an den Adressaten geschickt; 
dieser kann nach dem Einloggen auf seinem Rechner mit Hilfe eines Clientprogrammes 
inzwischen eingetroffene Post durchlesen, ablegen, löschen oder ın seinem Dateisystem 
abspeichern. Erreicht eine Mail ıhren Adressaten nicht, so wird sie mit einem 
entsprechenden Vermerk an den Absender zurückgeschickt. Zusätzlich zu der textuellen 
Nachricht kann einer Mail eine beliebige Dateı als „Enclosure” („Attachment”, „Anlage”) 
beigefügt werden, wobei binäre Formate wıe beispielsweise Programme meist konvertiert 
werden, um kritische, normalerweise nıcht übertragbare Zeichen durch unproblematische 
Zeichen zu ersetzen. Entsprechend konvertierte Dateien müssen auf der Zielmaschine 
rückübersetzt werden. 


8.2.2. Mailing-Listen 


Soll eine Mail mehrere Teilnehmer erreichen, zum Beispiel dıe Mitglieder einer 
Diskussionsrunde, so besteht dıe Möglichkeit, als Ziel alternativ eine Liste mıt den Adressen 
aller Teilnehmer zu verwenden bzw. die Mail an den Verwalter einer solchen Liste zu 
schicken. Entsprechend wird dıe Mail an alle aufgeführten Adressen weitergeleitet. Trifft 
der Listenverwalter dabei eine Auswahl unter deneingegangenen Beiträgen, so spricht man 
von einer moderierten Liste. Um an einer Diskussion innerhalb einer solchen Gruppe 
teilzunehmen, ıst es nur notwendig, sıch ın dıe entsprechende Verteilerliste eintragen zu 
lassen. Mailing-Listen können außerdem zur Verbreitung von elektronischen Journalen ım 
Netz verwendet werden. Mailing-Listen können manuell geführt und verwaltet werden; eine 
automatische Verwaltung realisiert Zistserv. Der einzelne Nutzer kann sıch über bereit- 
gestellte Kommandos selbst aus der Liste aus- oder sıch in diese eintragen. Nebenher 
archiviert Listserv eingegangene Diskussionsbeiträge durch sogenannte Log-Files und 
ermöglicht es so, auch später ın Diskussionsrunden einzusteigen bzw. sıch über deren Verlauf 
zu informieren. 
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8.2.3. News (Usenet Diskussionsgruppen) 


NetNews und Newsgroups setzen ım Gegensatz zu Listserv nıcht voraus, dass man sich ın 
eine Diskussionliste einträgt, um entsprechende Beiträge zu erhalten. Sie wenden sıch eher 
an einen Nutzer, der zu einem bestimmten Zeitpunkt Informationen und Meinungen zu einem 
bestimmten Thema gesammelt erhalten möchte. Mit Hilfe eines entsprechenden 
Hilfsprogrammes, einem Newsreader, können die nach Themen hierarchisch geordneten 
Newsgroups nach interessanten Gebieten auswählt und die Beiträge bzw. Artikel gelesen und 
auf den eigenen Rechner kopiert werden. Die sogenannten Newsgruppen oder Usenet News 
bieten eine schwarzen Brettern nachempfundene Möglichkeit, Diskussionsbeiträge, Angebote 
und Kommentare weltweit und online auszutauschen. 


8.2.4. Telnet - interaktives Arbeiten mit entfernten Rechnern 


Der Service Telnet bildet einen weiteren wichtigen Basısdienst ım Internet. Mittels einer 
Telnetverbindung kann über das Internet ein Remote-Login auf anderen Rechnern 
durchgeführt werden. Telnet wırd für mehrere Aufgaben genutzt: es ıst möglıch, auch über 
große Entfernungen auf den eigenen Rechnerbereich zuzugreifen, um ın der gewohnten 
Arbeitsumgebung zu sein und benötigte Dateien und Werkzeuge zu nutzen oder einfach nur 
die inzwischen angekommene Mail zu lesen. Ungenutzte Systemressourcen und CPU-Zeiten 
von Superrechnern können einem größeren Kreis von Nutzern zur Verfügung gestellt. 
Prımär werden Telnet-Verbindungen jedoch dazu verwende, um auf fremde 
Informationssysteme und Literaturdatenbanken über das Internet zuzugreifen. 

Früher, bevor der PC seinen Zug durch die Welt angetreten hat, war es üblich, dass auf einen 
(Groß-)Rechner über ein sogenanntes Terminal zugegriffen wurde: ein Bildschirm mit einer 
Tastatur. 

Daher leitet sich der Begriff Terminalemulation ab: ein Programm, das dıe Funktionalität 
eines Terminals bietet. 

Der Netscape Navigator (und andere Webbrowser) ermöglichen nıcht direkt eine Telnet- 
Verbindung, es können aber ın der Regel externe Programme (wıe das mit Windows für 
Workgroups oder Windows NT mitgelieferte telnet .exe) eingebunden werden. 


8.2.5. FTP - File Transfer Protocol (Dateitransfer) 


Vıa FTP kann ein Anbieter allgemein Dateien ım Internet zur Verfügung stellen. Der an 
einer bestimmten Dateı interessierte Nutzer loggt sıch auf dem FTP-Server der Maschine eın, 
welche den Dienst und die Dateı anbietet. 


Viele FTP-Server bieten einen allgemeinen Zugang, das heißt, man loggt sıch mit 
"anonymous"' als Benutzernamen und der eigenen E-Mail-Adresse als Password ein. In 
dıesem Fall spricht man von anonymem FTP. Der FTP-Server bietet dem eingeloggten 
Nutzer Kommandos zum Sıchten der zur Verfügung stehenden Dateien, dıe wie ın einem 
Dateisystem angeordnet sınd, durch das der Nutzer navigieren kann. 

Interessante Dateien können auf den eigenen Rechner übertragen werden; zusätzlich kann der 
Nutzer oft eigene Dateien an den FTP-Server übertragen. 

Bei der Datenübertragung stehen zwei Übertragungsmodi zur Verfügung: der ASCH-Mode 
dient zur Übertragung einfacher Textdateien, wobei der Zeichensatz auf verschiedenen 
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Betriebssystemen entsprechend auf der Zielmaschine umgewandelt werden. Der 
Binary-Mode lässt die Datei unverändert und wırd zum Beispiel für dıe Übertragung von 
Programmen oder Grafikformaten verwendet. 
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Das File Transfer Protocol (ftp) dıent zum Austausch von Dateien zwischen verschiedenen 
Rechnern. Dieser Dienst kann mit eigenen Programmen wıe beispielsweise WS_FTP unter 
Wındows (siehe Bild oben) verwendet werden, ftp kann aber auch ınnerhalb der 
WWW -Browser (Netscape Navigator, Opera etc.) genutzt werden. 


Wo meist das anzugebende Übertragungsprotokoll http: // lautet, wird in solch einem Fall 
ftp:// angegeben. 


8.2.6. Archie (Suchen auf ftp-Servern) 


Um auf Dateien vıa FTP zugreifen zu können, müssen diese erst lokalısıert werden, das heißt, 
der in Frage kommende FTP-Server und der Pfad der Dateı müssen spezifiziert werden. 
Archıie ıst ein einfaches Hilfsprogramm, welche es erlaubt, Suchanfragen nach bestimmten 
Dateinamen oder Teilen daraus zu stellen. Entsprechend liefert Archıie Serveradressen und 
Pfade möglicher Dateien. Eine Suche über Archie setzt voraus, das der Dateiname genügend 
über den Inhalt der Dateı aussagt. Sowohl FTP als auch Archie können auch vıa Mail 
genutzt werden. Bestimmte Server ım Internet interpretieren den Inhalt eingehender Mail als 
FTP- bzw. Archie-Kommandos und antworten dem Absender durch eıne Mail, mit der auch 
angeforderte Dateien übertragen werden. 
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8.2.7. Gopher (textorientiertes, hierarchisches Menüsystem) 


Gopher ist ein hierarchisch angeordnetes Informationssystem, das aus Textdokumenten 
besteht, dıe keine Hyperlinks (das heißt keine mit der Maus oder Tastatur anwählbaren Quer- 
verbindungen) wie ddeWWW-Dokumente enthalten. 


Gopher ist zwar nicht so schön bunt wıe das World Wide Web, aber weltweit gibt es doch 
(noch) eine große Anzahl von Gopher- Servern, auf denen - vor allem im wissenschaftlichen 
Bereich - umfangreiche Informationen bereitliegen. 


8.2.8. WWW - World Wide Web 


Das World Wide Web verknüpft - ähnlich wıe Gopher, allerdings graphisch aufgepäppelt - 
verteilt im Internet vorliegende Quellen durch Hypertextverbindungen. Durch Grafiken, 
unterschiedliche Schriftformen oder Zahlen gekennzeichnete Begriffe können ausgewählt 
werden, um über dıe Hypertext-Referenz das nächste Dokument aufzurufen. Der Nutzer 
kann so durch den Informationsraum navigieren, wobei auch auf verschiedenen Rechnern 
abgelegte Daten unter einer einheitlichen Oberfläche zugänglich sınd und assozıativ 
miteinander verknüpft werden. 

Das World Wide Web entstand 1993 bei CERN (sıehe hierzu [CERN] und [W3C] ım 
Literaturverzeichnis). 


8.2.9. IRC - Internet Relay Chat 


Das Internet Relay Chat (IRC) beruht im Gegensatz zu den News oder ListServ-Listen nicht 
auf dem Austausch von abgelegten Nachrichten, sondern erlaubt eine dırekte Kommunikation 
mit allen Onlıne-Partnern über das Internet. IRC ıst ın verschiedene Kanäle aufgeteilt, dıe 
jeweils unter einem bestimmten Thema oder Szenario organisiert sind und zum Beispiel als 
Diskussionsforum oder auch zum einfachen Smalltalk benutzt werden. 


Zum Thema IRC (Chat) gıbt es unter http’/iirc.pages.de/ und auf der Seite 
http://virtual-village.de/internet/irc/ weitere Informationen. Außerdem gibt es eine Übersicht 
zum Stichwort Chat bei web.de. 


8.3. Intranet 


Unter einem /ntranet versteht man die Nutzung der mit dem Internet aufgekommenen 
Kommunikations- und Informationsstrukturen, allen voran das Übertragungsprotokoll 
TCP/IP, auf das in den Online-Unterlagen'“* noch eingegangen werden wird. 

Dabei werden die Daten, Informationen und Kommunikationsmöglichkeiten jedoch lediglich 
firmenintern - nicht unbedingt aber nur hausintern - zur Verfügung gestellt. Für weitere 
Informationen zum Thema Intranet seı auf dıe Informationen von Jürg Keller hingewiesen, 
die im World Wide Web'” abgerufen werden können. 


122 Siehe: http://www.be.bib.de/-fhdwbm/work/internet/proto.htm 
122 Die Adresse der Seiten von Jürg Keller lautet http://www.simsy.ch/intranet/. 
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8.4. Multimedia im Internet: Sound und Video 


Vorhandene Sound und Videodateien können verhältnismäßig einfach auf einer WWW-Seite 
eingebunden werden. Zum Abspielen muss der entsprechende Webbrowser entweder das 
Dateiformat direkt unterstützen oder ein Programm, ein sogenanntes Plug-In, aufrufen. Es 
gibt mittlerweile viele Zusatzprogramme, mit denen fast jedes Dateiformat abgespielt werden 
kann. Die verschiedenen Formate haben unterschiedliche Vorzüge und auch Nachteile. Wenn 
Sıe selber Webseiten entwickeln wollen, dann sollten Sie die meistverbreiteten Dateiformate 
kennen. 


8.4.1. Einige Dateiformate für Video und Audio 


Nachfolgend seien die gebräuchlichsten Dateiformate ın den Bereichen Video und Audio 
kurz aufgeführt'”*. 


AIFF (Audio Interchange File Format) 
Das AIFF ıst das Standarformat für den Macintosh. Es wurde 1988 von Apple entwickelt und 
basıert auf dem EA IFF 85 Standard for Interchange Format File von Electronic Arts. 


WAV 
Ist das Standardformat für Wındows-Rechner und basıert ebenfalls auf dem EA IFF 85 
Standard. 


AU 
Dieses ıst der Standard auf Unix-Rechnern. Aufgrund seiner recht guten Kompressionsrate 
wurde es zum Standard ım Internet. Jeder Browser unterstützt dieses Format. 


MPEG Audio (MPEG 1) (Motion Picture Expert Group) 

Als ein neuer Standard scheint sich der MPEG-1 Layer 3 durchzusetzen. Durch 
pychoakustische Kompressionsalgorıthmen können Kompressionsraten von 12:1 erreicht 
werden. Allerdings benötigt man zum Abspielen spezielle Software, deren 
Decoderalgorithmen sehr rechenintensiv sınd. 


MIDI 

MIDI ıst ein Standard für dıe Ansteuerung MIDI-fähıger Musikinstrumente. MIDI-Dateıen 
enthalten Informationen wıe Tonhöhe und -länge, sınd also eine Art elektronisches 
Notenblatt. Mittlerweile ıst fast jede Soundkarte mit einem midi-kompatiblen Soundchip 
ausgerüstet. MIDI-Dateıen zeichnen sıch durch ıhre geringe Größe aus und werden daher oft 
als Hintergrundmusik für Webseiten genutzt. 


Quicktime 

Quicktime ıst der Standard für Videodateien auf dem Macıntosh. Es wurde von der 
International Standards Organısaton (ISO) als Dateiformat für den neuen 
Multimedia-Standard MPEG-4 bestimmt. 


AVI (Video for Windows) 
AVI-Dateıen sınd der Vıdeostandard auf Wiındows-Rechnern. 


124 An dieser Stelle noch einmal herzlichen Dank an meinen Kollegen Dr. Stefan Nieland von der FHDW Paderbom; er hat 
dıesen Abschnitt zusammengestellt. 
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MPEG Video (MPEG 2) 

MPEG Video ist ein systemübergreifendes Dateiformat mit sehr hohen Kompressionsraten. 
Zum Abspielen benötigt man eine hohe Rechnerleistung oder eine geeignete 
MPEG-Steckkarte. 


Streaming Media 
Normalerweise muss eine Dateı komplett aus dem Internet geladen werden, bevor sıe 
betrachtet werden kann. Streaming Media schaft hier Abhilfe: 


l. der Computer wırd zum Radıo bzw. zum Fernseher 


2. durch immer schnellere Übertragungsraten und bessere Kompressionsalgorithmen gelingt 
es, Musik und Videos live auf dem Computer abzuspielen. 


Produkte 

l. RealAudio/Real Video von Progressive Networks 
2. VıvoActive von Vivo-Software inc. 

3. LiquidAudio von Liquid Audio Inc. 

4. VDOLive von VDOnet Corporation 
5 


Netshow von Microsoft Corporation 


VRML 

VRML ıst das Akronym für Virtual Realitiy Modelling Language. Mit Hilfe dieser Sprache 
lassen sıch dreidimensionale Räume und Gegenstände beschreiben. Es lassen sıch dabeı 
Lichtquellen, Kamerapositionen, Oberflächen, Bewegungen und auch Töne definieren. 


Genau wie HTML liegen VRML-Dateıen in einfachen Textdateien vor. Zum Betrachten bzw. 
zum Durchwandern der VRML-Welt braucht mach einen VRML-Browser. Einer der 
prominentesten VRML-Browser ıst der Cosmo-Player von Sılıcon Graphics. Er wird vom 
normalen Internetbrowser aufgerufen, sobald man auf eine Seite mit VRML-Daten stößt. 
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8.4.2. Graphikformate im WWW 


Für computererzeugte Graphiken wird im WWW hauptsächlich das GIF-Format verwendet 
(Graphics Interchange Format), das eine maximale Farbtiefe von 8 Bit oder 256 Farben 
gestattet. Merkmale des GIF-Formats: 


l. Verwendung des Lempel-Ziv-Welch (LZW) Kompressionsalgorithmus, der eine 
verlustfreie Reduzierung des Datenvolumens der Graphik gewährleistet (vgl. Abschnitt 
1.6. auf Seite 46). 


2. GIF-Bilder werden umso besser komprimiert, je mehr gleichfarbige Sequenzen sie 
enthalten 


LZW: Horizontale Sequenzen gleichfarbiger Pıxel werden durch eine Zahl ersetzt, dıe die 
Länge der betreffenden Sequenz definiert, während identische horizontale Linien zusätzlich 
zeilenweise komprimiert werden. Das Kompressionsverhältnis liegt beim LZW-Verfahren 
überlicherweise beı 4:1. 


Neben dem GIF- wird auch das JPG-Format im World Wide Web eingesetzt. Das 
JPG-Format heißt richtig JPEG-Format (Joint Photographic Expert Group). Das 
Komprimierungsverfahren basiert auf der Trennung von Farbtönen und der Helligkeit, wobei 
das gesamt Bild ın Bereiche unterteilt wird. Für dıe Kompression wird dabei eine relativ 
exakte Schwarzweißkopie des Originals erstellt, während detaillierte Farbnuancen, die vom 
Auge (im Idealfall) ohnehin nıcht wahrnehmbar sınd, verworfen werden. Praktisch bedeutet 
das, das Bild wırd mıt zunehmender Kompression unschärfer. 


Im Unterschied zum GIF-Format resultiert die JPEG-Kompression daher in jedem Fall ın 
einen Qualitätsverlust. Insgesamt bewegt sıch das Kompressionsverhalten dabeı zwischen 
10:1 und 100:1. 


Außer JPEG und GIF wırd auch das (nıcht mehr so ganz) neue Format PNG (Portable 
Network Graphics) zunehmend eingesetzt, das die Vorteile von GIF und JPEG bündeln soll. 


8.5. Einführung in HTML 


Aus Platzgründen'” wird an dieser Stelle kein HTML-Kurs wiedergegeben; einen solchen, 
vielleicht den besten, finden Sie als Spiegelung der Originalquellen'” eines Kurses von 
Stefan Münz unter der URL 
http://www.be.bib.de/FHDW /Intranet/selfhtml/selfhtml.htm bzw. unter 
http://www.pb.bib.de/FHDW /Intranet/selfhtml/selfhtml.htm. 


15 Die Online-Materialien zur Seitenbeschreibungssprache HTML im FHDW-Intranet finden Sie unter der Adresse 
http://www.bg.bib.de/FHDW ’Intranet/winformatik/04inet3.htm. 
12° Die Original-URL der Seiten von Stefan Münz ist http://www.netzwelt.com/selfhtmV . 
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A. ANHANG 


A.1. Auszug aus einer ASCII-Tabelle 


Nachstehend wırd ein Auszug aus der ın Deutschland unter Windows üblichen 
ASCII-Tabelle (sogenannter ANSI'”’-Code) wiedergegeben. 


32 33 | 34" 35# 36% 37% 3& 39° 40(0 41) 
42% 43 + 44, 45 - 46. 47 / 480 491 502 51 3 
52 4 5335 5146 557 5658 579 58: 33:5 60 < 61 = 
62 > 637? AA 6A HB G6/C 68ED 69E OF T7IG 
/?2?H 731 74) 5>K 7L 7/7’/M 78eN 70 80P 8RQ 
2R O(B3ES HT BL BE V ETW Ex 8EIY 9O0Z 9L 
92\ 3] 4A 95 _ 9%, 97a 8b 9 c 100d 10l1e 
102 f 103 g 104h 105 i 106 j 107 k 1081 109 m 110 n 111o 
112p 113q 114r 115s 1l6t 11/u 118v 119w 120x 121 y 


1z 17124 | 1126 -tt12-> 12910 130 , 131 f 
132 „ 133... 134 $ 135 + 136° 137% 1385 139 < 140 
1'z 14310 1440 145 ‘ 146 ° 147“ 148” 149° 150- 151 - 


MR 
HI 
> 
HI 
[I 


ı 


102 ° 153" 1548 15» 1566® 1570 158z 159Y 160 161; 
1624 163£ 164m 165Y 166 ! 1678 168" 1690 170° 171« 
12? - 173- 174® 1757 176° 177 = 178? 1793 180° 181y 
182 1 183 « 184 , 185 ' 186° 187» 18% 189% 190% 19: 
192 A 193 A 194 Ä 195 A 196 Ä 197 A 198 £ 199 cC 200 E 201 E 
202 E 203 E 204 i 205 i 206 1 207 Ti 208B 209 N 21006 2116 
2126 2136 2146 215 x 2160 217Ü 218 U 2190 200 21Y 
2226 223R 24a 25a 26& 227& 28ä 229& 230 = 23lc 
2328 2336 2346 2356 2361 237 i 2381 2395 2408 24 
242 6 2436 246 2456 2466 247 = 2480 249 ü 250U 25lü 
252 ü 253y 254b 255 Y 


127 ANSI - American National Standardisation Institute, Normungsinstitut in den USA 
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A.2. Dateinamenendungen und Dateiformate 


Nachstehend eine selbstverständlich höchst unvollständige Auflistung von Dateiformaten und 
den ın der Regel damit assoziierten Dateinamenendungen (-erweiterungen, Extensions). 


Programm / Sparte Dateinamenendung Bemerkungen 

Textverarbeitung 

Microsoft Word für .doc Proprietäres Format'” 

Windows 

Lotus Word Pro Iwp Proprietäres Format; 
zahlreiche Importfilter'” 

Corel WordPerfect (keine spezifische Endung) Proprietäres Format; 


zahlreiche Importfilter 


Tabellenkalkulation 
Microsoft Excel ‚xls Proprietäres Format, einige 
Importfilter 
Lotus 1-2-3 .wks, .wk4, .123 Proprietäres Format, einige 
(jenach Version) Importfilter 
Graphik 
Corel Draw .cdr Vektorgraphik'”'; 
proprietäres Format 
Adobe Photoshop ‚phs, .tif ‚phs: Bitmapgraphik'"'; 
proprietäres Format 
‚tif: Bitmapgraphik; 
offenes Format 
Paintbrush, Paint .pcx, .bmp offen gelegte Bitmapgraphik 
(-formate) 
Paint Shop Pro (Shareware) .pcx, .bmp, .jpg, .tif, .gıf beherrscht sehr vıele 
u.v.a.m. Bitmapformate'°° 


22 Ein proprietäres Format ist ein firmenspezifisches, nicht offengelegtes Format, die meisten Programme anderer 
Hersteller können daher ein solches Format nıcht oder nur schlecht lesen bzw. interpretieren. 

1? Unter einem Importfilter versteht man ein (mitgeliefertes oder separat einzuspielendes) Zusatzprogramm, mit dem man 
ein fremdes Dateiformat ın ein Programm einlesen kann. 

13° Unter Vektorgraphik versteht man das Vorgehen, bei dem jeweils ein gesamtes Graphikobjekt bearbeitet wird; 
beispielsweise ıst ein Kreis ın einem Vektorgraphikprogramm als Objekt zu behandeln und kann jederzeit gelöscht, 
anders gefärbt oder sonstwie manipuliert werden. 

I Im Gegensatz zur Vektorgraphik wird bei einer Bitmapgraphık jeder einzelne Bildpunkt isoliert behandelt und 
gespeichert. Ist ein Kreis einmal gezeichnet, so ıst er bei einer Bitmapgraphik einfach dıe Summe seiner konkreten 
Bildpunkte. Ein Vergrößern oder Verkleinem oder Umfärben eines solchen Kreises erfordert einen sehr vıel höheren 
Aufwand als beı einer Vektorgraphik. 

132 GIF und JPEG sind ım Internet nutzbare Graphikformate. 
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Datenaustauschformate 


praktische alle ‚txt pures ASCII- oder ANST'- 
Textprogramme Textformat, das ın bezug auf 


dıe Formatierung nicht mehr 
als Zeilenumbrüche 
konservieren kann 


zahlreiche ‚rtf RTF: Rıch Text Format; von 

Textverarbeitungs- Microsoft vorgegebenes, 

programme offengelegtes Dateiformat 
zum Austausch von 
Textdokumenten 

Internet-Browser u.a. ‚htm, .html HyperText Markup 
Language 


Seitenbeschreibungssprache 
für das Internet 

Adobe Acrobat, ‚pdf Offengelegtes Format von 

Adobe Acrobat Reader Adobe'°*, das als 
Datenaustauschformat durch 
den kostenfrei abgegebenen 
Acrobat Reader allerdings 
vor allem ım 
Offline-Publishing 
(CD-ROM) weite 
Verbreitung gefunden hat. 


133 ASCI steht üblicherweise für den unter DOS benutzten Code; unter Windows wird ein ab Zeichen Nr. 128 anderer 
ASCII-Code eingesetzt, der dann ın der Regel ANSI-Code genannt wırd (ANSI=American National Standards Institute). 

134 Sıehe hierzu dıe Erläuterungen auf den Webseiten von Adobe Deutschland: 
http://www.adobe.de/products/acrobat/adobepdf.html 
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A.3 PGP - Pretty Good Privacy 


Nachstehend wird eine Quelle aus dem World Wide Web auszugsweise wiedergegeben. Die 
Original-URL ist http://www.tu-chemnitz.de/-hot/pgp.html. Autor der Seite ıst Holger Trapp. 
Der Text basiert auf der letzten dokumentierten Änderung der Webseite vom 22.Juli 1999. 


PGP - Pretty Good Privacy 


PGP ist ein ursprünglich von Philip Zimmermann entwickeltes, weit verbreitetes und 
kostenfrei erhältliches kryptographisches Werkzeug, das ım zusammen mit der Software 
verteilten Manual wıe folgt charakterisiert wird: PGP combines the convenience of the 
Rivest-Shamir-Adleman (RSA) public key cryptosystem with the speed of conventional 
cryptography, message digests for digital signatures, data compression before encryption, 
good ergonomic design, and sophisticated key management. And PGP performs the 
public-key functions faster than most other software implementations. PGP ıs public key 
cryptography for the masses. Zum Funktionsumfang gehören u.a. folgende Dienste: 


Ww Digitales Sıgnieren von Dokumenten und Nachrichten 


Digitale Signaturen gestatten es dem Empfänger/Leser, mit hoher Sicherheit festzustellen, ob 
eine Datei, E-Mail etc. authentisch und ınteger ıst, d.h. tatsächlich vom angegebenen 
Autor/Absender stammt und nicht durch Dritte erstellt bzw. von diesen nachträglich 
verändert wurde. Außerdem ist es für den Unterzeichner praktisch unmöglich, die geleistete 
Unterschrift später abzustreiten. Digitale Unterschriften ermöglichen also dıe Sicherung der 
Authentizität und Integrität von Nachrichten sowie einen Urhebernachweis. 


W Verschlüsselung von per Computernetz transportierten Dokumenten und Nachrichten 
(E-Mails) 


Computernetze wıe z.B. das Internet sind als potentiell unsicher zu betrachten. Es besteht 
technisch die Möglıchkeit, fremde Daten zu lesen und auch zu manipulieren. Durch eine 
Verschlüsselung unter Verwendung sog. symmetrischer Verfahren lässt sıch die 
Vertraulichkeit der über das Netz ausgetauschten Informationen erreichen, d.h., nur die dazu 
berechtigten Empfänger gelangen ın den Besitz der vertraulichen Information, da nur sıe die 
verschlüsselte Nachricht entschlüsseln können. 


Werden die betreffenden Dokumente zusätzlich digital sıgniert, so lassen sıch neben der 
Vertraulichkeit auch noch dıe o.g. Eigenschaften (Authentizität, Integrität, Urhebernachweis) 
erreichen. 


Ein wichtiges Anwendungsgebiet von PGP ıst der kryptographische Schutz von E-Mails. Die 
Nachrichteninhalte werden dabeı mit Hilfe des symmetrischen Algorıthmus IDEA 
verschlüsselt. Die Verteilung der hierfür benötigten Schlüssel erfolgt mit Hilfe des 
asymmetrischen RSA-Verfahrens,. das außerdem noch der Erstellung und Verifikation 
digitaler Signaturen dient. Der entscheidende Vorteil asymmetrischer gegenüber 
symmetrischen Verfahren besteht darın, dass der Schlüsselaustausch keinen sıcheren Kanal 
erfordert, sondern problemlos über öffentliche Kanäle (Telefon, Internet, ...) erfolgen kann. 
Unter Verwendung von PGP ıst es daher relatıv leicht möglich, mit bisher unbekannten 
Personen oder Gruppen vertraulich zu kommunizieren. 
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W Schlüsselverwaltung 


Die für dıe beiden zuvor genannten Funktionen benötigten Schlüsselpaare sowie dıe zu ihrer 
sicheren Weitergabe benötigten Zertifikate können durch PGP erzeugt und in sog. 
Schlüsselringen verwaltet werden. 


W Konventionelle Kryptographie zum Schutz von Dateien ım Dateisystem 


Vertrauliche Informationen sollten auch ım Dateisystem eines Computers verschlüsselt 
hinterlegt werden, da sonst generell die Gefahr besteht, dass sıe ın falsche Hände gelangen. 
Dies betrifft nıcht nur netzbasıerte Filesysteme (AFS, NFS, ...), wie sie z.B. ın Rechenzentren 
typisch sınd, sondern auch Festplatten ım eigenen PC sowie Disketten, die entwendet oder 
leicht kopiert werden können, sofern andere Personen Zugang zu ihnen haben. 


PGP gestattet deshalb den Schutz privater Datenbestände durch konventionelle 
Kryptographie, konkret durch den Algorithmus IDEA. Als externe Repräsentation der 
Schlüssel dienen vom Nutzer gewählte Passphrases. Dabeı handelt es sich im Gegensatz zu 
Paßwörtern um beliebig lange Zeichenfolgen (z.B. ganze Sätze mit Leer- und 
Sonderzeichen). Um einen Mißbrauch ın der Praxis auszuschließen, sollte man die 
Passphrases stets hinreichend lang und qualitativ so gut wählen, dass sıe mit an Sicherheit 
grenzender Wahrscheinlichkeit nıcht erraten werden können. 


Unterstützte kryptographischer Verfahren 


Die internationale Version von PGP basiert auf den folgenden drei kryptographischen 
Algorıthmen: 


W IDEA, 
w RSA, 


W MD. 


RSA und IDEA gelten gegenwärtig als sehr sıcher, da es trotz intensiver Kryptoanalyse durch 
viele anerkannte Kryptologen aus dem akademischen und kommerziellen Umfeld nicht 
gelungen ıst, diese Verfahren zu brechen. Zumindest liegen darüber keine 
Veröffentlichungen vor. Man muss dabei aber immer damit rechnen, dass es durchaus (z.B. 
bei den technisch und personell sehr gut ausgestatteten Geheimdiensten) der Fall sein kann, 
dass Verfahren existieren, die eın teilweises oder vollständiges Brechen dieser 
Kryptosysteme gestatten. 


Davon wird die Öffentlichkeit nur in Ausnahmefällen erfahren, da sich das 
Mitteilungsbedürfnis der Geheimdienste und bestimmter staatlicher Behörden sehr stark ın 
Grenzen hält. Ein Beispiel hierfür ıst die Geschichte der Public-Key-Kryptographie. Als 
deren Erfinder werden Whitfield Diffie und Martın Hellman sowie unabhängig von beiden 
auch Ralph Merkle angesehen. Es gılt allerdings mittlerweile als ziemlich sicher, dass der 
NSA (National Security Agency der USA) und ähnlıchen Organısationen dıe der 
Public-Key-Kryptographie zugrunde liegende Idee schon eher als den drei genannten 
Wissenschaftlern bekannt war. 
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Einige Informationen dazu wurden von Steve Bellovin auf der Seite _The Prehistorv of Public 
Key Crvptography_ [http://www.research.att.com/-smb/nsam-160/] zusam- 
mengetragen. 


In den dort erwähnten, ım Dezember 1997 veröffentlichten Papieren der CESG 
Communications-Electronics Securitv Group _ [URL: http://www.cesg.gov.uk/] 
schreibt der mittlerweile verstorbene CESG-Mitarbeiter James H. Ellıs, dass er bereits ın den 
60er Jahren dıe Idee der Public Key Cryptography (PKC) entwickelt hatte, damals unter der 
Bezeichnung Non-Secret Encryption (NSE). Im Januar 1970 publizierte er im (geheimen) 
CESG-Report The Possibility of Secure Non-Secret Digital Encryption sein Existence 
Theorem, also den Nachweis, dass es NSE bzw. PKC überhaupt geben kann. Aus anderen 
CESG-Reports geht hervor, dass die CESG das Prinzip der bis heute breit genutzten 
asymmetrischen Verfahren Diffie-Hellman (1976) und RSA (1978) bereits einige Jahre vor 
deren Veröffentlichung ın der akademischen Gemeinde kannte. Diese Papiere der CESG 
stehen unter der URL http: //www.cesg.gov.uk/about/nsecret .htm öffentlich 
zur Verfügung. 


Der Algorıthmus MDS5 wurde ursprünglich als ein sehr starkes Verfahren betrachtet. Neuere 
Untersuchungen durch den deutschen Kryptologen Prof. Hans Dobbertin haben aber gezeigt, 
dass Teile des Verfahrens erfolgreich attackiert werden können, so dass das Vertrauen ın die 
Kollisionsresistenz des MDS relatıv stark gesunken ıst. Zwar ıst es bisher nıcht gelungen, das 
gesamte Verfahren zu brechen, allerdings wird bei der Entwicklung neuer Protokolle, 
Verfahren und Werkzeuge der MD5 meist nıcht mehr favorisiert, so wie das noch bis etwa 
1995/96 der Fall war. 


Für weıtere Details seı auf dıe folgenden beiden Dokumente verwiesen: 


W Dobbertins Artikel The Status of MD5 After a Recent Attack, der im Volume 2, No. 2 
(Sommer 1996) der von der Fırma RSA Data Secunities, Inc. (RSADSI) herausgegebenen 
Zeitschrift CryptoBytes erschienen ist: 


http://www.rsa.com/rsalabs/pubs/cryptobytes/html/article_index.html. 


W Bulletin Nr. 4 der RSA Laboratories vom 12. November 1996 mıt dem Titel On Recent 
Results for MD2, MD4 and MD5. Es informiert über dıe bisher entdeckten Schwächen ın 
den drei genannten Hashfunktionen, schätzt deren Folgen ab und gıbt Empfehlungen für 
den Einsatz dıeser Algorıthmen. Das Dokument kann per WWW über die Seite 
http: //www.rsa.com/rsalabs/html/bulletins.html bezogen werden. 


IDEA, der International Data Encryption Algorıthm, ıst ein 1991 von Xuejıa Laı und James 
L. Massey entwickeltes symmetrisches Verfahren mit einer festen Schlüssellänge von 128 
Bit. Zur Ver- und Entschlüsselung einer Nachricht wird derselbe Schlüssel verwendet. Es seı 
darauf hingewiesen, dass IDEA patentiert ıst und dass man für kommerzielle Anwendungen 
eine Lizenz benötigt. 


PGP 2.6.x chiffriert generell alle Nutzerdaten mit IDEA, wobei der Schlüssel je nach 
Anwendungsmodus aus einer vom Anwender freı wählbaren Passphrase abgeleitet oder 
zufällig erzeugt wird. Vor der Verschlüsselung werden dıe Daten komprimiert. Dazu 
verwendet PGP Routinen von Mark Adler, Richard B. Wales und Jean-loup Gailly, dıe aus 
dem relatıv bekannten Paket Info-ZIP stammen. 
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Das 1978 der Öffentlichkeit vorgestellte RSA-Verfahren gehört zur Klasse der asymme- 
trıschen bzw. Public-Key-Verfahren. Die drei Buchstaben im Namen stehen für die drei 
Entwickler: Ronald L. Rivest, Adı Shamir und Leonard M. Adleman. Dabei spielt jeweils eın 
aus einem privaten und einem Öffentlichen Schlüssel (Private Key und Public Key) 
bestehendes Schlüsselpaar eine Rolle. Lediglich der zur Entschlüsselung genutzte Private 
Key ist geheimzuhalten. Dagegen kann der zur Verschlüsselung verwendete Public Key 
bedenkenlos öffentlich bekanntgegeben werden. 


Möchte man verschlüsselte Nachrichten austauschen, dann genügt es, die öffentlichen 
Schlüssel der jeweiligen Partner zu beschaffen. Die Gefahr des Abhörens besteht dabeı nicht, 
da die Schlüssel ohnehin öffentlich sınd. Lediglich ıhre Manipulation muss zuverlässig 
verhindert werden. Dazu verwendet PGP sog. Zertifikate, dıe durch eine digitale Sıgnatur die 
Echtheit eines öffentlichen Schlüssels, d.h. dessen tatsächliche Zugehörigkeit zu seinem 
vermeintlichen Eigentümer beurkunden. 


PGP nutzt den relativ aufwendigen und daher zeitintensiven RSA-Algorıthmus nicht zur 
Verschlüsselung der möglicherweise sehr umfangreichen Daten der Anwender, sondern nur 
zur Erstellung digitaler Sıgnaturen sowie zur kryptographisch gesicherten Verteilung der 
zufällig generierten IDEA-Schlüssel, mit denen dıe Nutzerdaten chiffriert wurden. 


Die digitalen Unterschriften werden nıcht aus der Nachricht selbst, sondern aus dem mittels 
der Einweg-Hashfunktion MDS5 (MD steht für Message Digest) gebildeten "Fingerabdruck" 
der Länge 128 Bit erzeugt. Das Verfahren MD5 stammt wiederum von Ronald Rivest und 


wurde 1992 ım RFC 1321: The MDS5 Message-Digest Algorithm beschrieben. 


Unter einer Hashfunktion versteht man eine Funktion, dıe mindestens dıe folgenden zwei 
Eigenschaften besitzt: 


l. Sie bildet Daten beliebiger Länge auf Werte fester Länge ab. 


2. Der Funktionswert lässt sich aus dem Argument leicht (d.h. mıt wenig Aufwand) 
berechnen. 


Für die Kryptographie sind ın der Regel Einweg-Hashfunktionen von Interesse, also 
Hashfunktionen, die sıch nur äußerst schwer, d.h. mit extremem Aufwand (der möglichst die 
gesamte verfügbare Rechen- und Speicherkapazität bei weitem übersteigt) ınvertieren lassen. 
Einweg-Hashfunktionen zeichnen sich also durch die beiden folgenden zusätzlichen 
Eigenschaften aus: 


l. Es ıst rechnerisch nicht möglich, eine Nachricht zu ermitteln, die einen vorgegebenen 
Hashwert besitzt. 


2. Es ıst rechnerisch ebenfalls nıcht möglich, zu einer gegebenen Nachricht eine zweite, 
davon verschiedene Nachricht zu konstruieren, dıe denselben Hashwert wıe die erste 
hat. 


Für verschiedene Anwendungsfälle werden kollisionsresistente Einweg-Hashfunktionen 
gefordert. Darunter versteht man jene Einweg-Hashfunktionen, dıe als zusätzliche 
Eigenschaft die Kollisionsresistenz aufweisen. Sıe besagt, dass es rechnerisch unmöglıch ist, 
eine Kollision, d.h. zwei unterschiedliche, freı wählbare Nachrichten zu erzeugen, die 
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denselben Hashwert haben, auch wenn es ın der Praxis meist unendlich viele derartige 
Nachrichten gibt. 


In seinem Artikel The Status of MDS5 After a Recent Attack sagt Dobbertin, dass dıe von ıhm 
präsentierten Attacken für praktische Anwendungen des MDS5 zwar noch keine Gefährdung 
darstellen, einer solchen aber schon recht nahekommen. Deshalb empfiehlt er, den MDS5 
künfig nicht mehr ın Applikationen einzusetzen, die kollisionsresistente 
Einweg-Hashfunktionen benötigen, wozu typischerweise Verfahren zur Erstellung digitaler 
Sıgnaturen zählen. Als Alternativen nennt er SHA-I und RIPEMD-160. Diese beiden 
Verfahren werden allerdings von 2.6.x nıcht unterstützt. Bei PGP_5.x/6.x kommt dagegen 
vorzugsweise SHA-1 zur Anwendung. 


Wie das folgende Zitat aus einem News-Artikel zeigt, vertritt_Markus G. Kuhn die Ansicht, 
dass die Kollisionsresistenz von Hashfunktionen bei digitalen Signaturen entbehrlich ıst: 


Dass man fuer digitale Unterschriften Kollisionsresistenz einer Hashfunktion 
braucht halte Ich fuer ein weit verbreitetes Missverstaendnis. Die 
Einwegeigenschaft sollte ausreichen wenn man gesetzlich alle Hash preimages als 
unterschrieben ansieht. Nur der Unterschreiber kann Kollisionen ausnutzen, also 
muss das nur zu seinem Nachteil ausgelegt werden und schon braucht man keine 
Kollisionsresistenz mehr. Man muss dann nur sicherstellen, dass man keinen Text 
unterschreibt den man nicht selbst erstellt hat, aber das laesst sich ja durch 
Hinzufuegen von ein paar Zufallsbits an den Anfang eines Textes bevor man 


unterschreibt vermeiden. 


Aus dem gleichen Grund reicht es voellig, bei PGP nur die ersten 10 Bytes des 
Fingerprints zu vergleichen. Man kann so Platz auf Visitenkarten sparen ohne 


Sicherheit einzubuessen. 


Es empfiehlt sıch natürlich generell, regelmäßig und aufmerksam die neusten 
kryptographischen Erkenntnisse zu verfolgen, um so früh wıe möglich auf erfolgreiche 
Attacken gegen die eingesetzten kryptographischen Verfahren reagieren zu können. 


PGP S5ı, dıe internationale Freeware-Version von PGP 5.x, bietet eine hohe Kompatibilität 
mit älteren PGP-Versionen: 


W PGP 5ı kann Nachrichten, Schlüssel und Sıgnaturen von PGP 2.x verarbeiten, sofern dıe 
RSA-Schlüssel nıcht länger als 4096 Bits sınd. 


w PGP 5ı kann Nachrichten, Schlüssel und Sıgnaturen erzeugen, die durch PGP 2.6.x, nıcht 
aber durch ältere Versionen (z.B. PGP 2.3a) verarbeitet werden können (natürlich nur, 
sofern man RSA-Keys verwendet). 


W Fazit: Bei ausschließlicher Verwendung von RSA-Keys ıst PGP 5ı mıt allen heute 
gängigen PGP-Versionen kompatibel. DSA- und ElGamal-Keys sollte man aber nur 
verwenden, wenn der Partner mindestens über PGP 5.0 verfügt. 


PGP 5.x/6.x unterstützt bei den internationalen und einigen anderen Versionen weiterhin dıe 
Algorıthmen IDEA, RSA und MD5, um auch Nachrichten und Zertifikate verarbeiten zu 
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können, die mıt älteren PGP-Versionen erstellt wurden. Vorzugsweise werden aber andere 
kryptographische Verfahren verwendet, bei deren Einsatz folglich PGP-Dateien entstehen, 
mit denen die älteren Versionen nicht umgehen können. 


Das RSA-Verfahren wird dabei durch zwei verschiedene asymmetrische Algorıthmen ersetzt, 
die jeweils ein separates Paar aus öffentlichem und privatem Schlüssel verwenden: 


W DSA für das Erstellen digitaler Signaturen und 


W ElIGamal für das Verschlüsseln mit Hilfe eines Public-Key-Kryptosystems. 


Für das digitale Signieren und das Chiffrieren von Dokumenten werden hier also getrennte 
Schlüsselpaare verwendet, wogegen bei RSA ein und dasselbe Schlüsselpaar beide 
Funktionen erfüllt. Würde jemand z.B. durch staatliche Behörden gezwungen, seinen 
geheimen RSA-Key offenzulegen, um den Behörden das Dechiffrieren von Nachrichten mit 
vermeintlich krıminellem Inhalt zu ermöglichen, wären diese Stellen automatisch ın der 
Lage, beliebige Dokumente ım Namen der betreffenden Person digital zu signieren, wodurch 
sämtliche Signaturen, die mıt dem offengelegten Schlüssel erstellt wurden bzw. werden, 
ihren Sınn schlagartıg komplett verlieren würden. 


Beı der Trennung der beiden Schlüsselpaare ıst dies nıcht der Fall. Die Behörden können mit 
dem ElGamal-Key zwar Nachrichten dechiffrieren, nıcht aber Unterschriften fälschen, 
solange sıe nıcht ım Besitz des DSA-Keys sınd. 
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